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内 容 提 要 


自由 软件 Linux 操作 系统 源 代码 的 开放 ， 为 我 们 掌握 操作 系统 核心 技术 提供 了 良好 的 条 
件 。 本 书 共 分 13 FE, XI Linux WH 2. 4 版 的 源 代码 进行 了 较 全 面 的 分 析 ， 既 包括 对 中 断 机 
制 、 进 程 调度 、 内 存 管理 、 进 程 间 通 信 、 虚 拟 文 件 系 统 、 设 备 驱动 程序 及 网 络 子 系统 的 分 析 ， 
也 包括 对 Linux 整体 结构 的 把 握 、Linux 的 启动 过 程 的 分 析 及 Linux 独 具 特 色 的 模块 机 制 的 
分 析 与 应 用 等 。 其 中 重点 剖析 了 Linux 内 核 中 最 基础 的 部 分 : 进程 管理 、 内 存 管 理 及 文件 管 
理 。 

本 书 对 于 那些 准备 进入 Linux 操作 系统 内 部 ， 阅 读 Linux 内 核 源 代码 以 及 在 内 核 级 进 
行程 序 开发 的 读者 具有 非常 高 的 参考 价值 。 同 时 ， 操 作 系统 实现 者 、 系 统 程序 员 、Linux 应 
用 开发 人 员 、 购 入 式 系统 开发 人 员 、 系 统管 理 员 、 在 校 的 大 学 生 和 研究 生 及 对 Linux 感 兴 
的 用 户 均 可 在 阅读 本 书 中 受益 。 
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如 果 说 Linux 的 出 现 是 一 个 偶然 ， 那 么 ， 席 卷 全 球 的 Linux 热潮 则 是 一 个 奇迹 ，Linux 
正 以 势不可挡 的 趋势 迅猛 发 展 ， 其 发 展 前 景 是 无 法 预测 的 。 

HAW, “Linux 不 就 是 类 UNIX? ”是 的 ， 它 的 外 在 表现 形式 确实 与 UNIX 完全 兼容 ， 
这 也 是 它 赖 以 生存 的 基本 条 件 。 但 是 ， 它 的 内 涵 则 完全 不 同 ， 这 首先 体现 在 其 源 代码 全 部 重 
写 及 开放 ， 其 次 是 它 的 快速 更 新 和 发 展 ， 而 更 重要 的 是 世界 范围 内 众多 计算 机 爱好 者 能 通过 
Internet 参与 开发 ， 由 此 可 见 , 借助 于 Internet 的 肥沃 土壤 ，Linux 的 迅速 发 展 是 毫 无 置疑 
的 ! 





















































































































































实际 上 ，Linux 最 本 质 的 东西 体现 在 其 “自由 ”和 “开放 ”的 思想 ，“ 自 由 ”意味 着 
界 范围 内 的 知识 共享 ， 而 “开放 ” 则 意味 着 Linux 对 所 有 的 人 都 敞开 大 门 ， 在 这 开放 而 自 
的 天 地 里 ， 你 的 创造 激情 可 以 得 到 充分 的 发 挥 。 

Linux 内 核 源 代码 的 开放 给 希望 深入 操作 系统 内 部 世界 的 人 敞开 无 私 的 胸怀 ， 我 们 有 幸 
走 进 了 这 个 世界 ， 这 是 一 个 神奇 、 错 综 复杂 而 又 充满 诱惑 的 世界 ， 让 喜欢 迎接 挑战 的 人 们 可 
以 充分 检验 自己 的 勇气 和 耐力 。 

Linux 内 核 全 部 源 代码 是 一 个 庞大 的 世界 ， 大 约 有 200 多 万 行 ， 占 60MB 左右 的 空间 。 因 
此 ， 如 何在 这 庞大 而 复杂 的 世界 中 抓 住 主要 内 容 ， 如 何 找到 进入 Linux 内 部 的 突破 口 ， 又 如 
何 能 把 Linux 的 源 代码 变 为 自己 的 需要 ， 这 就 是 本 书 要 探讨 的 内 容 。 

首先 ， 本 书 的 第 一 章 领 你 走 入 Linux 的 大 门 ， 让 你 对 Linux 内 核 的 结构 有 一 个 整体 的 了 
解 。 然 后 ， 第 二 章 介 绍 了 分 析 Linux 源 代码 应 具备 的 基本 硬件 知识 ， 这 是 继续 向 Linux 内 核 
迈进 的 必 备 条 件 。 中 断 作为 操作 系统 中 发 生 最 频繁 的 一 个 活动 ， 本 书 用 一 章 的 内 容 详细 描述 
了 中 断 在 操作 系统 中 的 具体 实现 机 竺 

众所周知 ， 操 作 系 统 中 最 核心 的 内 容 就 是 进程 管理 、 内 存 管理 和 文件 管理 。 本 书 用 大 量 
的 篇 幅 描述 了 这 三 部 分 内 容 ， 尤 其 对 最 复杂 的 虚拟 内 存 管理 进行 了 详细 的 分 析 ， 其 中 对 内 存 
初始 化 部 分 的 详细 描述 将 对 矢 入 式 系统 的 开发 者 有 所 帮助 。 

在 对 Linux 内 核 有 一 定 了 解 后 ,读者 可 能 希望 能 够 利用 内 核 函 数 进行 内 核 级 程序 的 开发 ， 
例如 开发 一 个 设备 驱动 程序 。Linux 的 模块 机 制 就 是 支持 一 般 用 户 进行 内 核 级 编程 。 另 外 ， 
读者 在 进行 内 核 级 编程 时 还 可 以 快速 查阅 本 书 附录 部 分 提供 的 Linux 内 核 API 函数 。 

网 络 也 是 Linux 中 最 复杂 的 部 分 之 一 ， 这 部 分 内 容 足 可 以 写 一 本 书 。 本 书 仅 以 面向 对 象 
的 思想 为 核心 ， 分 别 对 网 络 部 分 中 的 四 个 主要 对 象 : 协议 、 套 接 字 、 套 接 字 缓冲 区 及 网 络 设 
备 接口 进行 了 分 析 。 有 了 对 这 四 个 对 象 的 分 析 ， 再 结合 文件 系统 、 设 备 驱 动 程序 的 内 容 ， 读 
者 就 可 以 具体 分 析 自 己 感 兴趣 的 相关 内 容 。 

Linux 在 不 断 地 发 展 ， 本 书 介绍 的 版 本 为 Linux 2. 4. 16。 尽 管 本 书 力图 反映 Linux 内 核 
较 本 质 的 东西 , 但 由 于 笔者 的 知识 有 限 , 对 有 些 问 题 的 理解 难免 有 偏差 ,甚至 可 能 有 “Bug”， 
希望 读者 能 尽 可 能 多 地 发 现 它 ， 以 共同 对 本 书 进行 改进 和 完善 。 
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在 本 书 的 编写 的 过 程 中 ， 笔 者 查阅 了 大 量 的 资料 ， 也 阅读 了 大 量 的 源 代 码 ， 但 本 书 中 反 
映 的 内 容 也 仅仅 是 Linux 的 主要 内 容 。 因 为 一 本 书 的 组 织 形成 是 一 种 线性 结构 ， 而 知识 本 身 
的 组 织 结 构 是 一 种 树 型 结构 ， 甚 至 是 多 线索 的 网 状 结构 ， 因 此 ， 在 本 书 的 编写 过 程 中 ， 笔 者 
深 感 书 的 表现 能 力 非 常 有 限 ， 一 本 书 根本 无 法 宫 括 全 部 。 在 参考 书目 中 ， 我 们 将 给 出 主要 的 
参考 书 及 主要 网 站 的 相关 内 容 。 

本 书 的 第 一 版 是 《Linux 操作 系统 内 核 分 析 》， 在 第 一 版 的 编写 过 程 中 ， 康 华 、 季 进 宝 、 
陈 轶 尺 、 张 波 、 张 一 及 胡 清 俊 等 参与 了 编写 。 第 一 版 出 版 后 得 到 了 很 多 读者 的 充分 肯定 和 赞 
扬 ， 并 授权 台湾 地 区 出 版 。 在 本 次 改版 的 过 程 中 ， 依 然 保 留 了 第 一 版 的 风格 ， 但 加 深 了 对 进 
程 管理 、 内 存 管 理 及 文件 管理 等 众多 内 容 的 剖析 。 

这 次 改版 由 于 时 间 仓 促 ， 加 之 作者 的 水 平 有 限 ， 书 中 有 些 术语 的 表达 可 能 不 妥 ， 有 些 内 
容 的 分 析 也 可 能 不 够 准确 ， 敬 请 读者 朋友 批评 指正 。 我 的 联系 方式 是 : cl jun@xiyou. edu. cn. 
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2) 0 D ü D D በ በ rpm 


000000 ID] Interrupt Descri ptor Table] D 00 256000000100 0 
OOO000000000000000000 LD 0 000 D D O00000000 2K 
םםםםםםםםםם‎ 260000000000000 80600000 


ዌቭ D D 0 00 DD wy 


000000 חש‎ Local Descriptor Table] N D 0 0 D D D D 0 0 0 0 0 D D 0 U 
ההשש םםםםםםםםםם‎ LOD D 0 D 0 0 0 0 D 0 D 0 0 0 0 0 0 D D 000 0 U 

በበበበበበበበበበበበ NDN 0 0 0 D 0 0 0 0 םםםםםההש‎ 
םםםםםםםםםםםםםםםםםםםםםם‎ GOT 








םםםםםםםםםםם 235 


םםםםםםהםםהאםםםםםםםםםםהםםםםהםםםםםםםםםםםםהם 
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በ 3200000000000000000000000000000000000000 
םםםםם‎ 216000 





















































15 2 1 0 
x na] 


02.16 000000 


DDD D DD 0 0 D D 082900‏ 130 15800 30000 םםםםםםםםם 
1099Q00000000000‏ 200000000 םםםםםםםםםםםםםםםםהם 
םםםםםםםםםסט T0000000000000000‏ םםםםםםםםם 
OOO0000000000000 FR Fequestor Privilege Level] 00000000‏ 
በጻ በበ በ D D 0 0 0 0 00 DU 00000 00 DU) D D D 0 0 0000 000 0 U‏ 
U U U UU U D 0 U‏ 
O0O00000000000000000000000000000000000‏ 
OOO00000000000000000000000000000000000000‏ 
OOO000000000000000000000000000000 8000‏ 
O0O00000000000000000000000000000000000‏ 
][ 





























በ 400000000 D D D DD D D D D D 0 0000 DD DD 000000 DDD D 0 0 
OOO0000000000000000000000000217Q00 


L1 















































160 0 D D 2 10 








םםםםםם םםםםםם ][ 


0217 00000000000000 


U U U U D U D 0 0 0 D 0 0 000000 DU 0 UD U D U 0 U D U 0 0 0000 U 
םםםםםהאםםםםםםםםםטםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 



















































































O0O00000000000000000000000000 
01000000000 160000000 320000000000 SO ANO 
በበበ DD DD 0000 DUD መሙበበበበበበበበበበበበበበበ[በበበ[;በ 
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U U 0 U D 00 0000000 U U UU U D U በ በበሀበበ 00 0 0 0 0 D 0 0 U D U 
OOO000000000000000 

SB 000 200000000000‏ 3200000000 04000000 
D 322000000‏ 
32 םםםםםםםםםםםםםםצ 320000000000 םםםםםםםםםם 
160000000000 םםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
































218000 םםםםםם 


ን 324 8858 AGB is fis de 
16 位 选择 器 [TT] 
















TI=1 320 Br Hi hb 





S 存储 器 
| _ 段 措 述 符 高 速 组 存 器 | 操作 数 




















GDT LDT 


በ] 218 OOOO 


[] 
[] 
[] 
[] 
[] 
O0O000000000000000000000000000000000000 
[] 
[] 
[] 
[] 


2.3.6 00000000 


U U U UD U U D 0 0 0 D U 0 0 0 U 00000 00 0 U 0 U 0 U D U 0 U 0 U D 0 U 
U U U UD U U በ] 0 0 D 0 0 0 0 U 00000 00 0 U DU 0 U D U 0 U 0 U D 0 U 
U U U UD U በ] በ 0 0 D 0 0 0 0 U 00000 00 0 U 0 DD U D U 0 U 0 U D 0 U 


EI ET EX ENE 























EET EL E 





































































































2.3.7 linux[] [I [] 


Intel DD DD በ በ |] በ በ በ 80860 00000 00 D 0 D 0 DD D D D 0 ROO 
160000 200000000000000000003600000000000000 
--32-- 









































[ Linux [ [ 


U D D D DD Dms D DDD 00000 Ime [O0O00000000000000 
U D D 0 0 D 0 D 0 U 00 00 םםםםםםםםההאם‎ lime] D 0 0 0 0 0 0 0 U 
םםםםםםם‎ RS 000000 00000 000 0 0 D 0 D D D 0 0 D 0 00 Lime 
U U 0 0000 U 


















































程序 员 可 见 的 程序 员 不 可 见 的 
፳፳፡፳ MG NABA {FE 
ES | Selector |! Base | 1 Lini | Attributes | 
og selector Base ስክ £ Lii Z Att ibutes : 
58 Selector | Base ። r Limit | Attribu es | 
DS selector Base a Limit ! Attribu es I 
FS selector ፡ Due "T Lii At ibutes | 
Gs selector 1 | ES GER fr 0 E ል tributes 








0 21900000000 


bn] D 0000000000000000 0000000000‏ 220000 ם 
Un D D DD D 0 D LD D 000 bp D D D D | Wnep []‏ 000000000000 
D 0 0 D 0 D 0 0 0‏ הפס 00 האשפש 0000 OO Ex]‏ 

Domm D D 0 D 1በበ[1በበበበበበበገበበበበበበ QW DDD 00000 
incl ude/ asmi 386/ segnent . h[] [| 

#lefine KERNEL CSOx10 

#Jefine KERNEL DS0x18 


H H i ndex=2, TI -0, RELAON 0 
D, index, TI, RI =O] D 
#lefine USER GS 0x23 D, index, TI -0, RPL=3 በ 
#lefine USER DS Ox2B D, index=5, TI -0, RPL=3 H 


በበበበበበበበበበበበቨዘበበበበበህቁመ[በበበበበበበበበበበበበበበ[;[ 
በ BaxOOOOOOOOOOOOOOOOO םהוש‎ D'aD DDD 400000 GY 
O, in D DD 0 00 GO DD DDD 0000 DDD DD 00000 DD [0 0 פא‎ 
0 בםםםםםםםםםםםםםםםםםםםש‎ RLO 0 D 0 00 0 Hone DDD D Ú 
םהצ+םםםםםםםםםםםםםםםםםםםם‎ 

D D DD DD [| በ DD arcW i386 kernel / head. SQ 1] 


ENR] gdt_tabl ef] 

. quad 0x0000000000000000  /* NIL descriptor */ 

. quad 0x0000000000000000  /* not used */ 

.quad OxOOcf9a000000ffff ^ /* 0810 kernel 4CB code at 0800000000 */ 
. quad Ox00cf92000000ffff /* 0818 kernel 4CB data at 0800000000 */ 
.quad OxOOcffa000000ffff ^ /* 0823 user 4B code at 0x00000000 */ 
. quad OxOOcff2000000ffff | /* Ox2b user  4CB data at 0800000000 */ 
.quad 0x0000000000000000  /* not used */ 


בם בם בם L3‏ 
Oooo‏ 
בם בם בם L3‏ 
Oooo‏ 
בם בם בם L3‏ 
Oooo‏ 
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e 0000000 ואס‎ 


. quad. 0x0000000000000000 
/* 
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/* not used */ 




















* The APMsegnents have byte granularity and their bases 
* and limts are set at run tine. 


/* 0840 APMset up for bad BCS s */ 
/* 0x48 APMCS cod */ 
/* 0x50 APMCS 16 code [] 16 bit] */ 
/* 0x58 APMIS data */ 


.fill וגא‎ 5*4 8,0 / space for TSS s and IIT s */ 
OO000000GT0Q0000 መ tabe] 00 Intl QOO@O00000 

በበበበበበበበበበበበበበበበበበበበበ[በበበበ[በበበበበ[ arn adn [ቨ[ በ [ D 

OOO 2050 40000000 40000000000 210000000000000 
e 000000 0 0 000000000] 


e OOOO ₪ 10000000 KA] 
e 00 DOO 10000 40000000 20000 
* 00 POO ang 40000000 
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O0O000000000000000000000000000000000000 
UU D U 0 U D 0 0 0 U 
U U U 0 00000 U 

















U U 




















RPLO D D DH mne 0 DDD D D D D 0 D 00 D D ሀ 8 Intel 1 
OOOO םםםםםםםםםםהםההאתע‎ 
U D DDD 0 םםםםםםםםםםםםםםםםבצ םםםםםם‎ 40000 
U U 0 0 APV D D 0 D 0 0 በ 
በ Intel [00000 

U D D 000 1:፲301[0[00 
םםםםםםם‎ EU D n 

םםםםםםםההאתע DDD DD D D 0 00 D‏ אשוםםםםםםםםםםםם 
U U U [በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U‏ 


םםםםםםםם 





OO0000000000000000000 948]00000000000000 
OOO 29000000000000000000000000000 O000000 
OOO0000000000000000000000000000000000000 
OO000000000000000000006nQ0Q00000000000 





OOO0000000000000000000000000 Intel 
DOO00000000006nsQQ0000000000000000000000 RL 


L1 


[] 
OO00000000000000 םםםםםםהמ‎ 
[] 








00000000 TS) D D D D IDIJII D me U 
U D D D D Dms D 000000 WOOO TS0000 
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24 000 


በገ U D U D 0 0 0 D 0 000 DUDU -0 0 0 U D U 0 0 0 000 U D 0 0 U U U 
U U U UD U U D 0 0 0 D 0 0 0 0 U 000000000 000 U 


Se 






































` 





























线性 地 址 空间 ”物理 地 址 空间 





02200000000000000000 


U D D D D בב‎ PONDO Ps00000000000000000 
םבםםםםםםםםםםםםם‎ RIO00000000000000000000 


E 


























U 
0 
U 
0 
U U D 0 U DU00000000 0 D 00 U U D 0 D U U 0 0 U U D 0 0 U U U U U page 
fram] DU 2.200 0000000000000000000000000000 
[] 
[] 
[] 












































U U 0 U D በ] [በበበ በበበ በ[በ0009 bu 
8038600 000000000000 48000000 4800000000000 
U DD DD 000 40000 8 086ወ68ቨ[ 460 000000000000 160000 
0 KOOO000000000000000000000000000000000 
םםםםםםםםםם‎ AK DDD DD DD 0000 DDD DD 00000 000 
םםםםםםםםםםםםםםםםםהע םםםםםםםםםם‎ 20000 
U U -0 D U D 0 0 0 D 0 0 D 0 0 D D U D 0 0 U D 0 0 0 0 0 0 0 000 0 U U U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 ሀቨ 0 U 
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OOO0000000000000000000000 4000000000000 co 
በበበበበ OGO000000000000 20000000000000000000 
በመጩበበበበበ 100000 200000000000000000000000 


םםםםםםת 


























ID D 0010000000 U 


U U U U D U 0 U 0 U D uu 
በ 8038600000 IMIDO0000000400000000000000000 
U D D DU 0 00 DD 0 4M/O00000000000000000000000000 
OO000000000000000000000000000 200000—000000 
OO0000000000000000 1000 
OO0000000000000000000«Q000000000000 0 
OO00000040000000000000000000 100000 3100 2000 
םםםםםםםםםםםםםםםםםםםםםםםםם‎ 1K0000000000 
םםםםםםםםםםםםםםםםםםםםםם‎ 48000000000 1K0000 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 100000 214 


[] 








U U U 





U 





120 D DDD 00000 D DD D DD 0 0 





OO 22100000000 
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200000000 םםםםםםםהםםםםם 
U U 0 U D 0 0 00 UU D 0 0 0 090000 U‏ 
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线性 地 址 物理 地 址 

31 2221 12114 0 31 2221 1211 01 

| 8% | x | wee 
















































































































































































| HÆR 

ተህ 目录 项 i "ng 
1 

页 目录 表 HE‏ קל 











0 221 000000 


200000 


400000 1040000000000000 00 200000000000+ ם 
OOO 222000‏ 
e 0 314200 2000000000000000 2000 00000 20000‏ 
1024000000 320000000000000000000000 
e 0 0000 DDD DD PAD DDD DD 0000 DDD D 0 0 0 D 0 000‏ 
U U U U U‏ 
e 0 1000/0000 20000/0000000000000000000000‏ 
םםםםםםםםם 300000000000000000000000000 000 
223000 00000 
PW Page Wite Through] D D D D D D D 0 D 00 D D D D 0 0 0 0 0‏ 300 ם - 
1000000000 000.000 0 0 הא OOOO‏ 
Pay Page Cache 228 D D D D D D D 0 0 0 0 DD D D 0 1000‏ 400 ם 。 
U U U 0 U U‏ 























1554 3~0 位 页 表 地 址 os#p 
23--16፤፤ lle4fy ፪ se Hh BE 


31--244፤ 191267 Hp bt 


022 000000000 
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በ] 223 0 USO RW DDD U 


e [+האאםםםםםםםםםםםםםםםםםםכם‎ 

- 0 700 PageSzeN 0 D D D D D 0 D 0 DDD D D D 10 0 DD D D 480 
U U U UD D U D 00 U D 0 U 

םםםםםםםההאתעםםםםםםםההגרפם - 


20000 


803860 D 0 D 0 D D 0 D D D D 0 0 0 DD D D D 10240000000 400000 
םםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ ጁቂበበበ[በበበበበበ[;ቨ8 
l2000000000 224000 





A POD | PWT | WS 











3~0 位 页 面 地 址 OS Hj 


11~4 位 页 面 地 址 
19~12 位 页 面 地 址 








0000000 224 ם 


በ 3101200 20000000000 6000 0500 9) 110 DD 0000 U 
00000 600000000000000000000000D00010 

460 D D D 0 0 0 00 DDD D 0 0 0 1024Q00000000000000 1024 
ואו בםםםםםםםםםםםםםםםהם‎ 0000000000 480000 
םםםםםםםםםםםםםם‎ 4%[ 


םםםםםםםםםםםםהת 


> 3200000000000000 בםםםםםםםםםםםםםםםםםםםם 
22000 םםםםםםםםםםהם 


— 38 — 








Linux 


0 0 481220 100 3200000000 בםםםםםםםםםםההנפטםםםם 
G300000000000000000000‏ 40 םםםםםםםםםםםםםםם 
U U U‏ 
20000000 00 200 32000000000 בםםםםםםםםםםםם 
Dung 20000000 21A2Q0000000000000000 400000‏ 
32000000 םבםםםםםםם 
U D DDD MA 0Q00000000000000 20000000000 320‏ 
U U U U U‏ 




























































































410000 
U D DDD 000 nta 0 DDD DD DD 0 0 0 DD D D 0 D 0 00 MMQO 226 
U U U 


OO0O0000000000000 320000000000000 100000000 
በ 2000000 






















































































































































































31 2221 - 0 res 
TD 物理 存储器 
31 22 21 12 11 ዕ 
CR3: | 
== | 一 一 一 一 | RB ee il 
4 
形成 32 位 | E 
页 目录 项 
ES 
es 
' et 
形成 页 面 地 址 页 表 起 始 地 址 
nært tak 
32 位 物理 地 址 











0225 320000000000000 
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线性 地 址 




























































































ee መ 


242 000000 


O0O000000000000000000000000000000000 
םםםםםםםםםםם‎ 386000000000000000000000000 
2000000000000000000000 280000000000000 
OOOOOOOD0O00000000000000000000000000000 
DOO00000000000000000000000 000000 

DO000002%W0000000000000000000000000000 
00002200000000000000000"O00000"0"O 


命中 


将 高 20 位 页 面 地 址 送 
A, MENTÈRE 失败 ፦ 
FE, ፳፳-ጅ፳ 
法 淘汰 一 个 入 不 使 用 
的 页 面 项 地 址 两 级 查 表 机 构 | = 


- ጋ ማሙ: 


0227 0000000 
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O L3 ጩ E3 בם‎ ጩ בם‎ 
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25 limx[(][] D D U 


በበበ]በ1በእ=ቧ8መ8በበገገበ በበ በበበበበበበበበበበበበ[በ[[[ 

e חםםםםםהםםםהםהםםםהםהםםהםההםםםההםהםםהההםהה האתעג‎ 
OOO0000000000000000000000000460 

e åinxJ000000000000000000000000000000000 
בםםםםםםםםהםםהםהה הא‎ 

סםםםםםםםםםםםםםםםםהםהםההההההה<אעהםםםםםםםםם 
OO A pha] Sm] UtraSPART] Intel Itanium] DOO 4000000000000‏ 
U D DD D DDD D 0 DD DD DDD 0 0 0 D በበበ 2 28000000000 000 DD nx‏ 
30000000 000 

s |] 0 U PG) Page Gobal Directory] 

s |] [ [] [] PMP] Page Mddl e Drectoryl] 

. UU ፻፲] Page Tabl ef] 

በበ Eng DD DD DDD DDD 000 DD DD D 0 ntel DDD DDD DDD 0 
በበበ D D D D Dna 0 0 D DDD DDD DD DDD 0 D 0 DDD 00 0 


























线性 地 址 











































































































ee 
FJ 
p 
—& 
-= 
ቁስ. 
"LL 


























CR3 





















































BAR 中 间 目 录 
H 228 limx( Dl 


םםםםםםםםםםםםהם 251 


OO0O00000000000000000000000000000000000 
በበ DDD DD DDD DDD DDD DD DD D DD D D D D D Dnes DD DDD 0 
U U 1 1 0 [ቨ] ፲ ם‎ incl ude/asmi 386/0 0 0 0 page. H]pgtabl e. h[] potabl 6- 2l evel . h 
000000 


100000 
U D D D D א‎ PM] PO O0000400000000000000000000 
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በ] D በ D pod t pi t [] pte 11 pte | Page table Entry[T] D page hD 00000 
typedef struct 1 unsigned long pte low } pte t; 
typedef struct + unsigned long pnd; } pnd t; 
typedef struct í unsigned long pod; } pgd t; 
typedef struct + unsigned long pgprot; } pgprot t; 
በበበ በፀአጩበበበበበበበበበበበበበበበበበበበበሸበ[ሸ[በ[በ[በ[በ[[ 
መ በበበ በበ] በ በ በ1] በበበ ገበ በበበበበበበገበበበበ በበበ በ[በ[በበ; 


0000000000000 
#iefine pte val] ךא‎ [] [] XJ] . pte low) 
#defi ne pnd val] x D 0 x0 . pod] 
#defi 86 pgd val] x] [] 0 x] . pod] 
00 2200 22Q0000000000000000000000000000 


U D D D D D D D D D D ] pgrot t D D utu 
typedef struct { unsigned long pgprot: } pgprot t; 
#define pgprot val xj — (][ X] . pgprot[] 
OO poro OOOO 22400000 1200000000 9000 םםםפ‎ 
pgtal be. h[] 00000000 
#lefine PAGE PRESENT 0x001 
#lefine PAGE RW 08002 
#lefine PACE UBER 08004 
#lefine PAGE PW 08008 
#lefine PAGE ככ‎ 0 
#lefine PAGE ACCESSED 0 
#lefine PAF D RIYOx040 
#lefine PAGE PSE 0x080 /* 4 פא‎ [or 2M] page, Pentium if present.. */ 
#lefine PACE GML — 100א0‎ /* Gobal TLB entry PPro+*/ 
በገ] በበበ በበ ገ በበ በበበበበበበገነበበበበበበበበገበበበበበ[[ 


U D DD DDD DD 00 peable.h[ 00000 
extern pgd t swapper pg di ]ץע‎ 1024]: 
extern unsi gned 1 ong po0[ 1024]; 


swppe pg dir] D D D D 0 p00 0 0 D 00 D D D D 0 10240 0 
2J00000000 
Intel םםםםהםהםםםה‎ 229000 


31 22 21 12 11 0 




















0 2.29 200000000 


U U D 0 0 U 
#defi ne PAGE SHFT 12 
#define PACE SIZE [] 1U > PAE SH PIT 
#define PIRS PER PIE 1024 
#define PAGE MK |] +] PACE SIZE 10 0 
OO PACE התד‎ D D 0 D 00 0000 1200000 PAGE האל‎ 2 40960 00 
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PIRS PER PIE] D D U 00000 PAE MSkK በ J በ OxfffffO0000 d D D 0 0 D U L 
በ D በ በ 200 

PAIR SH FT 

#lefi ne PAIR SH FT22 

#lefine PIRS PERPG 1024 

061 ne PAIR SIZE 0 1U «PAIR SHFT[J 

#lefine PAIR MK [| +] PAIR SIZE 19 D 
PGIRSHFJO00000000000000000000 2020000000 
100000 PIS PER הפא‎ D ם םב 0 םה‎ Ra R SIZE] I D 0 0 00.0 2°00 4M 
PAIR MSKU Oxffc00000] D D D D D D D 0 D D 0 D 0 D D 0 0 

0 3] PMD SHET 

#lefine PMD SHFT 22 

#define PIRS PERPMD 1 

PM םםםםםםםםםםםהםםהםההה הח‎ 200000 Lin 386000 
0000000000000000000 ብበሀበበበሀበበበሀበበበ[በበ[በ[በ 
0000000000 20000 400000000000000000000000 


U U 














םםםםםםםםהם 2.5.2 


[] page. H] pgtable. hf] pgtabl e- 2l evel . P3000000000000000000 
OOO000000000000000000000000 


םםםםםםת 


static inline int pgd none] pgd t pod] {return O; } 
static inline int pod present[] pgd t pod] í return 1; + 
#define pte present] xi] [] [] xl] .pte low &[] PACE PRESENT | PACE PFOIN NI | 0 


pod none] D 0 D D D D D 00 0 00000 D D 0 D 000 DD DD 0 D 0000 U 
pgd present] D D D 0 0 0 0 100000000000000000000000000 
U U U U D U D 0 0 U D ሀ 0 በ 0 U 

pte present D D D D 10 O00 PD D 0 0 0 0 D D D D 0 O00000 GOO 
በገ በ በ U D 0 0 U D 0 000000000 U 


2J0000000 


#define pgd clear] xH] ዐዐ + } wile 0 0] 
#lefine pte clear] xp] do + set pte] xp pta] OOO: } Mile 0 0] 
pgd clear በበ 1] በገ ገበበበበበበበበበበበዘበበበበበ[በ በ በ pte clear 
000 םםםםםםםהס‎ 


D00000000000000 
U D D D D 0 0 potable hD 0000 21000000000 





-43-- 


በ21 
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םםםםםםםםםםםםםםםםהםם 




































































U U U U 
Set pte] U םםםםםםםםםםם‎ 
Pte read] |] OO 5 1111111010 በ11 በበበ በ ገገ 0 0 0) 0 0 DD 
Pte wite] [] QO Present [| 00 RadWite] O00 10000 00000000000 
Pte ጩባ] 0 QO Ger/ Supervisor 9 [] [] 
Pte dirty] l 00 GrtyGOO0000000000000 
Pre young] [] OO Ææcessed] 000000000000000 
Pte wrprotect[] [] 00 Fead/ Wi te [] [] 
Pte rdprotect[] [] 00 User/ Supervisor [] [] 
Pte nkwite 00 Mead Wite[] [J 
Pte _nkread 00 er Supervisor [] [] 
Pte nkdirty[] D 0 הצתם‎ [| D 1 
Pte nkcl ean] [] 0 Drty0 OM 0 
Pte _nkyoung 0 Accessed] 00 1 
Fte nkol dJ [| 0 Accessed] [] [] 0 
Pte nodifyf] p V] םםםםם‎ pU uuu uu 0 0 0 0000 v 
M ptef] [| O00000000000000000000 2000000 
Pte pte phys[] 0 OOO00000000000000000000 
Pre page] [] םםםםםםםםםםםםם‎ 





U U U U D U D 0 0 0 D 0 0 0 00 DU U D U 0 U DU 0 0 0000 0 0 0 0 DU U 


U U U U 0 U D U 


U D DDD cog 
UUUDUUU “ 
U U 0 0000 U 
OO CHU 
በ1119: U 
U U 0 0000 U 
U U 0 0000 U 
U U U U D U 


























O 38600000 
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ooo GnxsQ]O000000000000000000000000000.s8S00 














000000000000000000000 
2.6 linx[][] D 0 0 U 


O0O000000000000000000000000000000.6 
በበበበበበ በበ በበበ םםםםםםםםםםםםםםםש‎ CODE 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםיםםם‎ 
0 
U U 0 U D 00 000000000 UD 000 00 D 0 0 DU 0 00 U 
OOO0O0000000000000G000000000000000 
DOO00000000000000000000000000000 































































































በ] B5)0000000000000000000000000000 


በ inxJO000000000000 me םםםםםםםםםםםםםםםםה‎ ₪ 




















[] [ Linux UI 


261 AITO Intel 11111 1 [] 









































U U 0 0 0 DH meU םםםםםםההאא‎ D meU 0 0 0 0 00 0 0 0 0 0 00 0 U 
OOOO INO האתתם‎ O00 3860 D D D D D D D 0 0 DD 0 WX WXN DD U 
PP-100000000000 VA 680000 םםםםםםםםםםםםםםםםםהםה‎ 
0000 הצא‎ 000000 UNXUJU DD 1208060 00000000 םםםםההצא‎ 
U D D 00 אש‎ 0000000000000000000000000000000 
OO0O00000000000000 "םםיםםםםםםםםםםםםםםםםה האש‎ 
0 Aan 0 0 0 D D D D Intel הצא‎ 000 D DD 0 0 0 00 DD DD 000 D" D 
U” Dulu 


10 0 0 


በ Intel םםהה‎ DD DD DDD D 0 000 DD DD D D ጩ DD DD 00 U "0 
በበበበበበበ $” DU መቋበበበበበበበበበበበበበበበ[በበበበበበበ"ጅ[ 
“BOND AU D DDD 0000? םםה=‎ 22000000000000 


2000000 


Intel 0 םםםםםםםםהםהה הצא‎ Intl בםםםםםטםםםםםהםםהםםה‎ 
በበ] በበበ DD 000 0 AST DD DDD 0000 DOD 000 DD 00 D 0 UU 
םםםםםם‎ AS DD DD DD 00 D 0 D 00 0 

0000 Intel [] [] nov eax, [ ecx] 

0 AIST] | nov! [| %ecx[] , ax 


























l] 22 Intel ) AIST(] OOOO 

Intel DQ AIST [] 
nov eex 8 novl $8, 5988 
nov ebx, Offffh novi SOxffff, Yebx 
int 80h int 80880 
30000000 


D00000000000000000000000 ፲ጩቋበበበበበበበበበበጠሆ 
U 0 0 000 תםיהה הצא‎ OOOO 

000 O Intel | nov eax, [ebx45] 

[| ATIS] novl 5] 9ebx[] , 5888 


41000000 


Ine 000048 QOOOOO000000000mtel JOOOO0‏ ם 
segreg: | basedi ndex*scal edi spl] [ AIST] [] [] O %egreg: disp] base, index, scal e[T]‏ 
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QO index/ scal e/ di sp/segreg | D D 0 0 D D D D 0 D 0 00 seaer 0 
OO index] 0 scale] D D D D השפ‎ D D 0 0 DD D D D D D 0 00 0 D D D U 
U U 0 U D 0 0 0 000 DU U D U U 0 U 0 0 0 0 D ሀ ሀ ሀ በ ሀ ሀ segreg0 D UL U U 
AITO D D D D D D 0 scae/dspQOOOO000000" םםםם*‎ 2300000 
U U 0 U D 000 U 



































[ 3 םםםםםםםםםםם‎ 
Intel DQ AIST [] 

[] [| | ם‎ %egreg: disp] base, index, scale] , foo 

foo, segreg: [ base-ti ndex*scal 6-1 sp] 
nov eax, [ ebx420h] Mvl 0820] Yebx[] , Yeax 
add eax, [ ebx+ecx*2h Addl [] Yebx, cx, 0821] , ax 
lea eax, [ ebx+ecx] Leal 0 Yebx, 9ecx[] , ax 
sub eax, L ebx+ecx*4h- 20h] Subl - 0x20 Yebx, Yecx, Ox4[] , Yeax 

(D UU D UU ATST [] (] D] C] UO UU. C] U UU (I [baset ndex*scal ei 508 D O O 


U D D 0 0 0 00 disp] base index scale] 000000000 

OO0000000000000000000000000000000000bseyp 
OO0000000seleJ[IP00000000indkJO000000000000000 
U םםםםםםםםםםםההפפט‎ 


םםםםםםת 


םםםםםםםםםםםםםםםםםההצא םבםםםםםםםטםםםםםםםם 

w 00001600 6 00000 8000‏ "200 םםםםםם ירתםהםםםםהם 

D Intel םםםםםםםםםםםםםםםהה‎ D 0 byte ptr] vod ptr[] dwrd pir] 
“ dwrd’ 00“ הס‎ 0 2.400000000000 














U 4 U U U 0000 0 
Intel 0 [] ATST[] 0 
Mv al, bl novb bl , Al 
Mv ax, bx novw bx, 588 
Mv eax, ebx nov! Yebx, Yeax 
Mv eax, dvord ptr [ebx] nov! 0 Yb] , ax 





םםםםםהםההצא 262 
בםםםםםםםםםםםםםםםיםיםםםםםםםבפ םםםההםהאם በ‏ 
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[] [ Linux [] I 


AIS D 00 DDD 00 0‏ בםםםםםםםם 
QU D I GS) GNU Asendi y0 [] በ በ 0 Ú‏ ]1 


U D DDD 0000 DON 0 ሀቨ በ በ በ assem vi D 0 በ D D Hn 00 Ú D 
D D DD D 0 0 D 0 0 D D GSOOOOO 18900000 םםםםםםנ‎ esp Id 
መበበበበበበበበ םםםםםםםםם‎ ሟጩ[በበበበበበ[;ቨሀ 


as filenane.s -o filename. o 


O0O00000000000000000000000000000000000 


ld filenane. o - o fil enane 

OO filenae.o[] 0000000 filenane D 00 D 0 0 0 0 OOO 

GSD D D D ጠመ በ 0 D D D Intel 00000000000 ASIDO UNX 0 
U D DD 0 0 D 000 U 

U D DDD ecu CD በ0 שש‎ 000 0000000000000 

gcc -o 6888 e exanpl e. S 

U D D same. 5 D D 0 D D D D D D 0 D D D D D D D D D D D sad 0000 
00000000 םםםםםםםםצ‎ SOOO םםםםםםםםםם‎ CDD DDD U 
U #nclude[] #defi nel] Å fdef[] *endif ) 00000000 ge JO000000000 
DU D DDD CD 00000 U 


20 ATS? [] [1 O Section] 


0 המ .םםםםםםהםה האא‎ 0 DD D D D D 0000 DD DD 0 000 U 
םםםםם‎ 3000 
section .data D D D 0 D D 0 DDD 0 DDD DDD 00 DD DD D 00 0 D 0 U 


tut 
hello: .string "18110 world!\n" 
hello len : Long 13 


םםםםםםםםםםםםםםםםםםםםםםםםםםםם ה ה Section‏ 
OO0000000000000000000000 9000‏ 

mane: .fill 30 #0 000000000 

nane len: Tom 0 #0 0000000000 
U D D D D םםם‎ D D ךא‎ nanelenQ OOO OO000.bsQ)0000000 
םםםםםםםםםםםםםםםםםםםםםם‎ 0 
ם6.םם‎ D D ה‎ D D 0 D 0 ה‎ D D DDD 00000 DD D D 0 00 0 U 
OO0000.bsQOOO000000000000000000000040000000 



























































U D DD D D D 0 -.dat aÜ fest 4000000 eligi pn 0 üd.detan 00 4000 
בםםםםםםםםםם‎ 360000000000000 36000000 
section 6 האש םםםםםםםםםםםםםםםםההה‎ .bss0 00000 
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370000000 Assembler D recti vel] 


-sectim D D D DD 0 D D 0 0 D D GUD D 0 DDD 0 D 000 00 D‏ םםםםם 
l directi) D D D 0 D D D DDD .0 D D DDD DDD D 0 0 DD 0 (D 0 0 0 D 00 0‏ 
ቨ በ [| (T‏ הה OO0000000000000000 arch/i386/kernel/head SO‏ 

[] 10 .ascii "string"... 
„ascii D D [000000000000000000000000000000" 0 0 
U D DD 0 0 D DD 00 0 D 00 U 

በበበ 42828" ዐሽበበበበበበበበበበበበበ”ሆምበቨ‏ וש .םםםםם 
U D D 0 U‏ 

int nsg: 
. 88012 "Uknown 1 nterrupt\n" 

ቭ] . byte 000‏ ם 

.bytef] םםםםםםםםםםםםםםםטםםםםםםםםםםםםםהה‎ 
030 .fill OOD 

OO0.fill repeat , size, value 

በ በ repeat] size | value] DDD 0 0 DD RII 00000000 תת‎ 
repeat [10000 ወ size] [00000 GO 0000 G0000 aooo AO 
repeat ] ] 00 80000000000 4000000 GOO 4000000 value] 
size] value 1110101011 20000 value) 000000 value] ADO 
010000 size] DDD DDD sizeg 10 

OOOO Ex 000000000000000 ጩመ[በበበ[በ[በበበበበበበ 
.fill NR ORA, 8,0 /* space for TSS s and IDT s */ 

0000000000 8በበበበሀበበ 11 D D COD D 00 400000000 
[] ቭ] . gl obl synbol 
Oo D D D D D D 0 1d 1111 sym DO 0 0 D 0 0 0 0 0 0 D sø JO t 
בםםםםםםםםםםםםםםםםםםםהם‎ syn ood 

. 0 SYMBCL NAME] i dt] 

. gl obl SYMBOL NM] 0:11] 

በበ id 0 םםםםםה‎ 

[] 50 . quad bi guns 
.quadJ D D D D D | Boss] J0 00000000 Bom) [0000 8000 
OOOO bom) D BD DD D D 0 D D D 0 0 D 0 0 0 D ב‎ 8000 
םםםםםםםםהםםםםםםםםטםםםםם‎ 

. quad OxO0cf 9a000000ffff /* 0810 kernel 4CB code at 0800000000 */ 

. quad OxOOcf92000000ffff /* 0818 kernel 4(ቹ data at 0800000000 */ 


. quad OxOOcffa000000ffff /* 0823 user 4B code at 0800000000 */ 
. quad OxOOcff2000000ffff /* Ox2b user 4GB data at 0800000000 */ 


[] 6] . rept count 


l .rept O D. השפ‎ D 000000 count [000 
.rep 3 
.long 0 
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[] [ Linux [] I 





















































. endr 


U D U 
.log 0 
.long 0 
.long 0 
0 7] . space size, fill 
000000 םםםםםםםםםםםםה הצ‎ fill size በ fillOOOOOO 
DU DD DDD D םםםםםבגת‎ የ111 | ዐወ] በ በ arch/i380/ bootl/setup SOOO 


U U 
.space 1024 


OOOO םםםםםםםםםםםםהה הש‎ el 

[] ፪] . wrd expressi ons 

በበበ በበገበ በገ በበገበ 0 0 0 D D 0 D D 0 D U UD D UD 0 0 U 0 0 0 U 
00000 
gdt_descr: 

. vord GT ENR ESS 1 

OOOO gd descr] 0 | GI ENRES8 1 

[] 9] . long expressi ons 

UD .wrdg [J 

[] 10] .org newlc , fill 

U 0 D 0 D 0000 DD DD newlc[] Now Location Gunter[T] newlc[] 00000 
U U U U 0 0 0000 000 U 0 0 0 UD D 0 D U 0 U D UD D U 0 U D 0 U U oo I Uu 
OO ה6אא‎ 0 D 0 D D OO א‎ D D 0 0 D 0 D 0 0 D 0 D 0000 DDD D 0 
םםםםםםם‎ 0.00 D D D 0 0 D D 0 U 
U U U U 0 U UU 00 0 U 00 0 U D 0 D UD 0 0 D UD D UD D UD U D D U U UD 0 U 0 U 
በበበገገበበበበበበበበበበበበ fi0Q0000000000000000 fil p 
0000 םםםםםגת‎ O] 

OOO . org 082000 

FNR] oU 

U 0 D 0 D 00000 02000 0000000000000 po 





EI 


























2.6.3 gc[ [000 


በ Eng] 0000000 GGOO0000000000000000000 och 
OO“ asnt D D LU OG include/ asmi 386/ systemh[] D 1] 00000000 OOOO 
[] read crog [I] 

#defi ne read crog | [] (A 

unsigned int — dummy; ነ 
. asm [| \ 

"novi “ro, nt" V 
Ca DU dumylO; \ 

. dunmy; | 
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እ] 




















በ1100: 
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UDOOU0O0U00000000000000 cO00000 
םםםםם‎ dump D CD 0 D 00 D D D DD 0 0 ese D DD D D 0 D 0 0 agg a p U 
U D D 0 0 0 00 DD መ D D D 0 D 00 D DDD 00 DDD DD D D 0 DU 
U U U U D 00 0000000 U 0 DD U D 0 0 0 D 000 U 
םםםםםםםםםםםם‎ C0 00 DD DD 000000 DDD U 

















U U UD 000 c0000000000000000000000 


םםםםםםםםםםת 


. asm volatile [| "<asmroutine> : 
በበበ asm 0 D 00 በበበበበበበበበበበ volatile [IO00000000 
በበበ ጨመ በበበ በበ በበ በ DDD DD DD DD DD D DDD 0000 0 0 D 00 U 
e "ssnrouti ne2[] 000000000 D] “novl Aero ה"‎ D D D 0 D 0 “ D 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםלםםםםם.*‎ Cut 
םםםםםםםםםם‎ Intl DDD 800000000000000000000000 
U U D D D U D gel D 0 0 0 0 D 0 D 0 D D D D D D D 0 0 D 0 D 0 D D D D D 0 D D 


[] 


[] 
0 





[] 


output : input : nodify[] ; 


U U 


U U 
U U 





U U 


gccU CD UD 


U U U U DU U 
U U U U DU U 
U U U U DU U 




















በበበበበበበበ በበ NONTON NDN NON DN DN ONDOY 


[] Aero 


. 00000 ቁጨመመበበ በሀ በበበ 0 0 D D 0 D D U D D 0 U D 0 0 0 0 0 D U 
U םםםםםיםיםםםםםםםםםםםםםםםםטםםטםםםהםהנה, השא טפס‎ 


000000000 
"=" D. ሰጠበበ 





O0O00000000000000000000000 


“Dr” OOO0000000000000000000000000000000 


በ] Ganny J00000000000000 


U Dm [] 


. dunmy[] 

















“Om በበበበበበበበበበበበበበበበበበበ החש‎ 





በበ U D U 0 U 0 U D uu 





























2500000000000000000 



































0 2.5 םםםםםםםםםםם‎ 
U D U U 
m v,o 000000 
R םםםםםםםםם‎ 
Q 00000 eax] eb ec) edx በ 
I, ከ םםםםםםם‎ 
EF 00000 
G DD" DD" 
a bed [ 0 በ0 0 0 00 00 eax/ax/al, ebx/bx/bl, ecx/cx/cl ] edx/dx/ dl 
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5 5 000000000 esit] edi 


I በ በ በ በ በ O] 31 


U U [ [0 Input 0 0 0 D D D D D D D D 0 D 0 D" D "0 0 D 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D DUU 
י*םםםםםםם‎ er 2 םםםםםםםםםםםםםםםםםםם‎ 

U D D D D "םםםםםה הצא‎ memory DDD D na 0 n 
O0O00000000000000000000000000000 








U U U U 
U uuu 
U U U U 
U U U U 
U uuu 


EET ELE E) 


[] 
U U U 
U U U 




































































U U D U D 0 D D 0 0 0 D 0 D 0 D 0 0 0 0 D 0 D 0 D 0 0 0 0 U 
U U D D በ በበበ በበበ” P DD ሀ በ በ” ץש‎ 000000 
O systemhO [ [ሀ | | elit [H] 


#define clifQ _ asm volatile [ "di": : :"nenory'[ 
206nxJ0000000000 


Dn D D D | | | םםםםםםםםםםםםםםהםםהםהם>.הת .םהה הא‎ 
በ systemhO [] CD 0 D 0 D ü d d DD 7 C D U U 0 
0100000 
define save flags] x] . asm volatile [] "pushfl ; popl %":"=9' 0 x] : /* no input 
#efine restore flags] x] _ asm volatile [| "pushl % ; popfl": /* no output */ 
:"g 0X]: "nenory", "cc"[] 
010000000000000] 200000000000000 10000 pushfl 
D 0 000000000000 pg D D DDD በ D D በ በ םםםהשם‎ >D 0 0 D 
በበበበበበ በበ በበበበበበበበበበበበበበበ[በ[[[በበበበበ 2000 
02) 00000 
static inline unsi gned | ong get limt[] unsigned long segment [] 
1 
unsigned long limt; 
. asm [] "1511 94,99" 
:"ጃ" D 11፲81[ : "r" 0 segnent[] [D ; 
return limt+; 












































U U U 
[] U U 








ከመ D A000000‏ םםםםםםםםםםםםםםםםםםםםםםםםם 
segen D AT IS 0 0 0 0 D D 0 0 D segrent [] D] 0 0 B. B. 0 0 0 0 D D 0 D‏ 
100000 הת 0000 ዘመ በገ UD‏ 00000000000 

030000 
U åinxJO000000000000000000000000000000000 
U D DD 0 0 D DD 00 DD DD D D D D D D D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 
U D DD 0 0 D D D 0 D D በበ U D 0 D 0 0 D D D D 0 streng] O 
O00 arch/i 386] stri ng. h[] [| 
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gcc 


OU 


OU 


OU 


OU 


OU 


OU 
U U 



































OO Linux [ LH | 























static inline int strcnp] const char * cs, const char * ct] 


{ 
int dO, dl; 
register int _ res; 
. asm volatile Qj 

"1:\tl odsb\ At" 

"scasb\n\t" 

"jne 2f\n\t" 

"testb Wal, %% \ "+\ת‎ 

"ine Int" 

"xorl eax, 59885: nt" 

"jm 3f\n" 

"2:\tsbbl eax, 59885: n t" 
"orb $1, %&@l V n" 
ER 

:"=" | rell, "=85' 0 d0], "= 0 dif] 
:"1" H cs] , "2" H ct] D; 
return res; 
} 
በበበ WOOOOT MO Lab 0 PONDO NN NDN D DDD 00 00 U 
U U U U U U U በ በበበ D U U D 0 U 0 D 0 UD 0 D D UD 0 D በበ 0 D 0 D 0 D 0 U 
U U U D 0 U U D 0 0 U 
10 lodsb 1/0 D 0 0 0 D 0 D 0 Lest) 00 4000000 sil 00000000 
scash//JOOOOO000 4000 es:Fediln 0000000 uu 
jne2f//0000000000000002 

testb Yl 581 
jne 1b 

xorl %ax 5888 
jnp 3f 
2: sbbl ax Yeax 

orb $1 Yl 
3 
בםםםםםםםםםםםםםםםםםםםםם‎ %0 0 0 በ በ forvord] 00000 
0 3000000000000000000000000000000000000 
U U 
e JUD res] Ol al [0 d d d *9n p D D 
s OOOO ጪሪ በሀ በ110100000000080 א םםםםםםםםםםםםםא‎ 
በጩገከበ በ በ በበበ1በ[[0[0[ 
e 1]በ11]11.1 DD 20 DDD DD 0 0 DDD םםםםםםםםםםםםםא‎ ፻፲ 
በቨመበበ በ በበ [1በ01በበ[ [ 
በበበ በበገበበበበበበበ ገ በበበበበበበበበበበበበገበበበበበበ[በ[በበ[ 
በበበበበገበ ገ በበበ በበበ በበበ Inte 350 D DDD D 0 0 D 0 D 0 000 0 
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2.6.4 Intel 38110000 














በበበ Enx]00000000000000000000000000000000 
בםםםםםםםםםם‎ 86000000000 


1000000 

U U U U 

Br U U U 

፳፲ U U 0 U U U 
BIR U Uu 
DIS U Uu 
20000000 

U U U U 

CALL U U DU U 

JM U U 

LOP 0 םםםםםהאא‎ 
א‎ 0 BXO D DO 0 D 000009 םםםםםםםהה<א‎ 
RET U U 





םםםםםםתף 


U U U U 
אז‎ U uuu 
LEA U uuu 


(1፲ U Uu 
PCP D uut 

POA] PPA’ በ[1000000[0. 
PUSH OO 
PUSH] PAD D D D D D D 0 0 0 
XID 00 


4490000000 


U U U U 

ac 0 00000 

aD በ] 0[[ 0. 

GI D 00000 

LAH םםםםםםםם‎ AHD 0 D 
EPH] POPED U U 0 U D 000 U 
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t Linux | U I 
PUSH] PUSHED U D D 0 U 
SAFF םםםםםהםםההתאם‎ 
SIC U D D 0 U 
SID U D D 0 U 
SH U D D 0 U 
3 D D DD U 
U U U U 
NT U 
AND U 
CH U 
SAL/ SH. םםםםםםםםם‎ 
SAR uu 
SHD uuu 
TEST uuu 
XR U U 
6j00000 
U U U U 
CMS MPSS CMSWOMSD D J 0 D [| D] 
I NY I NSB I NSWI NSD 000000 
LOS LOEB LODBW LCSD U U U U 0 U 
MS WY MYSWNYSD [00000 
REP U U 
REPE/ REPZ םםםםםםם‎ 0000 
SCAS/ SCASB/ SCASW/ SCASD U U U U 0 U 
SIC 51፡8 SIGSW SIGSD U U U U 0 U 
תםםםםםםתח‎ 
U U U U 
CALL atu 
IN U D D D 0 0 U 
INO םםםםםםםםם‎ 
IFET U U D U 
JM U U 
US 00000 ₪ 
LES 00000 ₪ 
LES U 0 DDD FS 
LS utut ₪ 













































































ut Linux Ul 
LSS OOO00 SS 
MW םםםםםםם‎ 
PCP םםםםםםםםם‎ 
PUSH 00 
RET U U 
םםםםםםהה‎ 
U U U U 
APPL, U D D D 0 0 U 
ALIS םםםםםםם‎ 
HI 00 
TAR uuu 
Lar םםםםםםםם‎ 
IUD םםםםםםםם‎ 
LIDT U D D D 0 0 0 U 
IMW םםםםםםם‎ 
ISL U D D 0 U 
LIR U D D D 0 0 U 
MW בםםםםםםםםםם‎ 
SAT U D D D 0 0 0 U 
SI Dr U D D D 0 0 0 U 
SMW םםםםםםם‎ 
SIR U D D D 0 0 U 
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第 三 革 TEL) 


中 断 控 制 是 计算 机 发 展 中 一 种 重要 的 技术 。 最 初 它 是 为 克服 对 1/0 接口 控制 采用 程序 查 
询 所 带 来 的 处 理 器 低 效率 而 产生 的 。 中 断 控 制 的 主要 优点 是 只 有 在 1/0 需要 服务 时 才能 得 到 
处 理 器 的 响应 ， 而 不 需要 处 理 器 不 断 地 进行 查询 。 由 此 ， 最 初 的 中 断 全 部 是 对 外 部 设备 而 言 
的 ， 即 称 为 外 部 中 断 〈 或 硬件 中 断 )。 

但 随 着 计算 机 系统 结构 的 不 断 改 进 以 及 应 用 技术 的 日 益 提 高 ， 中 断 的 适用 范围 也 随 之 扩 
Ko 出现 了 所 谓 的 内 部 中 断 (或 叫 异 常 ), 它 是 为 解决 机 器 运行 时 所 出 现 的 某 些 随 机 事件 及 编 
程 方便 而 出 现 的 。 因 而 形成 了 一 个 完整 的 中 断 系 统 。 

本 章 主要 讨论 在 Intel 1386 保护 模式 下 中 断 机 制 在 Linux 中 的 实现 。 如 果 你 曾 有 过 在 
DOS 实 模式 下 编写 中 断 程序 的 经 历 ， 那 么 ， 你 会 发 现 中 断 在 Linux 中 的 实现 较为 复杂 ， 这 是 
由 保护 模式 的 复杂 性 引起 的 ， 因 此 ， 必 须 首先 了 解 硬件 机 制 对 中 断 的 支持 。 不 过 ， 不 管 在 实 
模式 下 还 是 保护 模式 下 ， 有 关中 断 实现 的 基本 原理 是 完全 相同 的 。 




























































































































































































































































































31 中断 基本 知识 


大 多 数 读者 可 能 对 16 位 实地 址 模式 下 的 中 断 机 制 有 所 了 解 ， 例 如 中 断 向 量 、 外 部 1⁄0 
WDA RFE, KEN ARTE 32 位 的 保护 模式 下 依然 有 效 。 两 种 模式 之 间 最 本 质 的 差别 就 是 在 
保护 模式 引入 的 中 断 描述 符 表 。 





















































3.1.1 Hi 


Intel x86 系列 微机 共 支 持 256 种 向 量 中 断 ， 为 使 处 理 器 较 容 易 地 识别 每 种 中 断 源 ， 将 
它们 从 0 一 256 编号 ， 即 赋予 一 个 中 断 类 型 码 2, Intel 把 这 个 8 位 的 无 符号 整数 叫做 一 个 向 
量 , 因 此 ,也 叫 中 断 向 量 . 所 有 256 种 中 断 可 分 为 两 大 类 :异常 和 中 断 。 异 常 又 分 为 故障 (Fault) 
和 陷阱 CTrap)， 它 们 的 共同 特点 是 既 不 使 用 中 断 控制 器 ， 又 不 能 被 屏蔽 。 中 断 又 分 为 外 部 可 
ቻ፳ጥቹ CNTR) 和 外 部 非 屏 蔽 中 断 OMI), PA 1/0 设备 产生 的 中 断 请 求 CORO 均 引 起 屏 
蔽 中 断 ， 而 紧急 的 事件 〈 如 硬件 故障 ) 引起 的 故障 产生 非 屏蔽 中 断 。 

非 屏 蔽 中 断 的 向 量 和 有 异常 的 向 量 是 固定 的 ， 而 屏蔽 中 断 的 向 量 可 以 通过 对 中 断 控 制 器 的 
编程 来 改变 。Linux 对 256 个 向 量 的 分 配 如 下 。 

e 从 0 31 的 向 量 对 应 于 异常 和 非 屏蔽 中 断 。 

e 从 32 47 的 向 量 ( 即 由 I/0 设备 引起 的 中 断 ) 分 配给 屏蔽 中 断 。 

e 剩余 的 从 487255 的 向 量 用 来 标识 软 中 断 。Linux 只 用 了 其 中 的 一 个 〈 即 128 或 0x80 
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[| | Linux | Ul 





















































向 量 ) 用 来 实现 系统 调用 。 当 用 户 态 下 的 进程 执行 一 条 int 0x80 汇编 指令 时 ，CPU 就 切换 到 
内 核 态 ， 并 开始 执行 system call C. ) WAZ 














3.1.2 外 设 可 屏蔽 中 断 


Intel x86 通过 两 片 中 断 控 制 器 8259A 来 响应 15 个 外 中 断 源 ， 每 个 8259A 可 管理 8 个 中 
断 源 。 第 1 级 〈 称 主 片 ) 的 第 2 个 中 断 请 求 输入 端 ， 与 第 2 级 8259A〈 称 从 片 ) 的 中 断 输 出 
端 INT 相连 ,如 图 3.1 所 示 。 我 们 把 与 中 断 控 制 器 相连 的 每 条 线 叫做 中 断 线 ,要 使 用 中 断 线 ， 
就 得 进行 中 断 线 的 申请 ， 就 是 IRQ (Interrupt ReQuirement )， 我 们 也 常 把 申请 一 条 中 断 线 
称 为 申请 一 个 IRQ 或 者 是 申请 一 个 中 断 号 。IRQ 线 是 从 0 开始 顺序 编号 的 ， 因 此 ， 第 一 条 IRQ 
线 通 常 表示 成 IRQ0。IRQn 的 缺 省 向 量 是 n+32; 如 前 所 述 ，IRQ 和 向 量 之 间 的 映射 可 以 通过 中 
断 控制 器 端口 来 修改 。 




























































































































































































IRQO( 时 钟 ) 
IRQ1 (BEE) 





IRQ3(tty2) 

IRQ4(tty1) 

IRQ5(XT Winchester) 
IRQ6(4K EK) 

IRQ7( 打 印 机 ) 

IRQ8( 实 时 时 钟 ) 


IRQ9( 重 定向 的 了 下 Q2) 











IRQI3(FPU 异常 ) 
IRQ14(AT Winchester) 
IRQIS 





图 3.1 级 连 的 8259A 的 中 断 机 构 






































并 不 是 每 个 设备 都 可 以 向 中 断 线 上 发 中 断 信 号 ， 上 只 有 对 某 一 条 确定 的 中 断 线 拥有 了 控制 

权 , 才 可 以 向 这 条 中 断 线 上 发 送信 号 。 由 于 计算 机 的 外 部 设备 越 来 越 多 ， 所 以 15 条 中 断 线 已 

经 不 够 用 了 。 中 断 线 是 非常 宝贵 的 资源 ， 只 有 当 设 备 需要 中 断 的 时 候 才 申 请 占用 一 个 IR, 

或 者 是 在 申请 IRQ 时 采用 共享 中 断 的 方式 ， 这 样 可 以 让 更 多 的 设备 使 用 中 断 。 

中 断 控 制 器 82594 执行 如 下 操作 。 

CD 监视 中 断 线 ， 检 查 产生 的 中 断 请 求 GIRO) (75. 

(2) 如 果 在 中 断 线 上 产生 了 一 个 中 断 请 求 信号 。 

a. TEBZSE AA IRQ 信和 号 转换 成 一 个 对 应 的 向 量 。 

b. 把 这 个 向 量 存放 在 中 断 控 制 器 的 一 个 1/0 端口 , 从 而 允许 CPU 通过 数据 总 线 读 此 
向 量 。 
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c， 把 产生 的 信和 号 发 送 到 CPU 的 INTR 引 脚 一 一 即 发 出 一 个 中 断 。 
d， 等 待 ， 直 到 CPU 确认 这 个 中 断 信号 ， 然 后 把 它 写 进 可 编程 中 断 控制 器 (PIC) 的 
— 1/0 端口 ， 此 时 ， 清 INTR 线 。 
(3) 返回 到 第 一 步 。 
对 于 外 部 1/0 请 求 的 屏蔽 可 分 为 两 种 情况 ， 一 种 是 从 CPU 的 角度 ， 也 就 是 清除 ef lag 的 
断 标 志 位 CIF), “4 IF=0 时 ， 人 禁止 任 何 外 部 1 / 的 中 断 请 求 ， 即 关中 断 ; 一 种 是 从 中 断 控 
制 器 的 角度 ， 因 为 中 断 控制 器 中 有 一 个 8 位 的 中 断 屏 蔽 寄存 器 〈IMR)， 每 位 对 应 8259A 中 的 
一 条 中 断 线 ， 如 果 要 禁用 某 条 中 断 线 ， 则 把 IRM 相应 的 位 置 1， 要 启用 ， 则 置 0。 
















































































































































































































































































3.1.3 异常 及 非 屏 蔽 中 断 


异常 就 是 CPU 内 部 出 现 的 中 断 ， 也 就 是 说 ， 在 CPU 执行 特定 指令 时 出 现 的 非法 情况 。 非 
屏蔽 中 断 就 是 计算 机 内 部 硬件 出 错时 引起 的 异常 情况 。 从 图 3. 1 可 以 看 出 ， 二 者 与 外 部 0 
接口 没有 任何 关系 。Intel 把 非 屏蔽 中 断 作为 异常 的 一 种 来 处 理 ， 因 此 ， 后 面 所 提 到 的 异常 
也 包括 了 非 屏蔽 中 断 。 在 CPU 执行 一 个 异常 处 理 程序 时 ， 就 不 再 为 其 他 异常 或 可 屏蔽 中 断 请 
求 服务 , 也 就 是 说 ， 当 某 个 异常 被 响应 后 ，CPU 清除 ef lag 的 中 IF iz, 禁止 任何 可 屏蔽 中 断 。 
但 如 果 又 有 异常 产生 ， 则 由 CPU BAF (CPU 具有 缓冲 异常 的 能 力 )， 待 这 个 异常 处 理 完 后 ， 才 
响应 被 锁 存 的 异常 。 我 们 这 里 讨论 的 异常 中 断 向 量 在 0 一 31 之 间 ， 不 包括 系统 调用 〈 中 断 向 
量 为 0x80 )。 

Intel x86 处 理 器 发 布 了 大 约 20 种 异常 (具体 数字 与 处 理 器 模式 有 关 )。Linux 内 核 必 
须 为 每 种 异常 提供 一 个 专门 的 异常 处 理 程序 。 这 里 特别 说 明 的 是 ， 在 某 些 异常 处 理 程序 开始 
执行 之 前 ，CPU 控制 单元 会 产生 一 个 便 件 错误 码 ， 内 核 先 把 这 个 错误 码 压 入 内 核 栈 中 。 

在 表 3. 1 中 给 出 了 Pentium 模型 中 异常 的 向 量 、 名 字 、 类 型 及 简单 描述 。 更 多 的 信息 可 
以 在 Intel 的 技术 文 挡 中 找到 。 






































































































































































































































































































































































































































































































































# 1 异常 的 简单 描述 

向 量 异常 名 类 别 描述 

0 除法 出 错 故障 被 0 除 

1 ሀዛጪ 故障 / BAB 当 对 一 个 程序 进行 逐步 调试 时 

2 非 屏 蔽 中 断 CNMI) 为 不 可 屏蔽 中 断 保留 

3 LES FE int3〈 断 点 指令 ) 指令 引起 

4 溢出 fal 当 into (check for overflow) 指令 被 执行 

5 边界 检查 故障 当 bound 指令 被 执行 

6 非法 操作 码 故障 当 CPU 检查 到 一 个 无 效 的 操作 码 

7 设备 不 可 用 故障 随 着 设置 cro በዛ TS Fras, ESCAPE 或 MMX 指令 
被 执行 

8 双重 故障 故障 处 理 器 不 能 串 行 处 理 异 常 而 引起 的 
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向 量 异常 名 Kill [pus 
协 处 理 器 段 越界 故障 因 外 部 的 数学 协 处 理 器 引起 的 问题 〈 仅 用 在 80386) 
无 效 TSS 故障 要 切换 到 的 进程 具有 无 效 的 TSS 
段 不 存在 故障 引用 一 个 不 存在 的 内 存 段 
栈 段 异常 故障 试图 超过 栈 段 界限 ， 或 由 ss 标识 的 段 不 在 内 存 
通用 保护 故障 违反 了 Intelx86 保护 模式 下 的 一 个 保护 规则 
页 异常 故障 寻 址 的 页 不 在 内 存 ， 或 违反 了 一 种 分 页 保护 机 制 
Intel 保留 / 保留 
浮 点 出 错 故障 浮 点 单元 用 信号 通知 一 个 错误 情形 ， 如 溢出 
对 齐 检查 故障 操作 数 的 地 址 没有 被 正确 地 排列 












































18 一 31 由 Intel 保留 ， 为 将 来 的 扩充 用 
































另外 ， 如 表 3.2 所 示 ， 每 个 异常 都 由 专门 的 异常 处 理 程序 来 处 理 〈 参 见 本 章 后 面 “ 寞 常 
























































里 “部 分 )， 它 们 通常 把 一 个 UNIX 信号 发 送 到 引起 异常 的 进程 
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# 2 W AD HD Pe BORE 
nJ M A 出 错 码 异常 处 理 程序 信号 

除法 出 错 divide error ( ) SIGFPE 
调试 / debug ( J) SIGTRAP 
非 屏蔽 中 断 CNMI / nmi ( ) None 

断 点 int3 ( ) SIGTRAP 
溢出 / overflow ( ) SIGSEGV 
边界 检查 / bounds ( ) SIGSEGV 
非法 操作 码 / invalid op ( ) SIGILL 
设备 不 可 用 / device not available ( ) SIGSEGV 
双重 故障 有 double fault ( ) SIGSEGV 
协 处 理 器 段 越界 / coprocessor segment overrun SIGFPE 

C 0 

无 效 TSS 有 invalid tss ( ) SIGSEGV 
段 不 存在 有 segment not present ( ) SIGBUS 
栈 段 异常 有 stack segment ( ) SIGBUS 
前 用 保护 有 general protection ( ) SIGSEGV 
页 异常 有 page fault ( ) SIGSEGV 
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15 Intel 保留 / None None 
续 表 
可 量 异常 名 出 错 码 异常 处 理 程 请 信号 
6 浮 点 出 错 / coprocessor error ( ) SIGFPE 
7 对 齐 检查 / alignment check ( ) SIGSEGV 








3.1.4 中 断 描述 符 表 











在 实地 址 模式 中 ， 














CPU 把 内 存 中 从 0 开始 的 IK 字 节 作为 一 个 中 断 向 量 表 。 表 中 的 每 个 表 























Bü 4 个 字 节 ， 由 两 个 字 节 的 段 地 址 和 两 个 字 节 的 偏 移 量 组 成 ， 这 样 构成 的 地 址 便 是 相应 中 
断 处 理 程序 的 入 口 地 址 。 但 是 ， 在 实 模式 下 ， 由 4 字 节 的 表 项 构成 的 中 断 向 量 表 显 然 满足 不 
了 要 求 。 这 是 因为 ，@ 除 了 两 个 字 节 的 段 描 述 符 ， 偏 移 量 必用 4 FURAN: OLA KWAK 
































式 切换 的 信息 。 因 此 ， 





























中 断 向 量 表 也 改 叫做 中 断 描述 符 表 IDT (Interrupt Descriptor Table)。 其 中 的 每 个 表 项 叫 
做 一 个 门 描述 符 (Gate Descriptor),“ 门 ”的 含义 是 当中 断 发 生 时 必须 先 通过 这 些 门 ， 然 后 
















































































在 实 模式 下 ， 中 断 向 量 表 中 的 表 项 由 8 NF TAK 3:8 3. 2 AA» 







































































才能 进入 相应 的 处 理 程 序 。 
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DPL 
MEE 


























1615 12 87 54 0 


















































段 描述 符 的 特权 级 
入 口 函数 地 址 的 偏 移 量 
段 是 否 在 内 存 中 的 标志 






























































段 选择 符 入 口 函 数 所 处 代码 段 的 选择 符 


D 
XXX 











其 中 类 型 占 3 位 ， 


1. 任务 门 (Task 


























标志 位 ，1=32 fy, 0-16 位 
3 位 门类 型 码 


图 3.2 门 描述 符 的 一 般 格式 
表示 门 描 述 符 的 类 型 ， 这 些 描述 符 如 下 。 




















gate) 











其 类 型 码 为 101， 门 中 包含 了 一 个 进程 的 TSS 段 选择 符 ， 但 偏 移 量 部 分 没有 使 用 ， 因 为 TSS 

















本 身 是 作为 一 个 段 来 对 待 的 ， 因 此 ， 任 务 门 不 包含 某 一 个 入 口 函 数 的 地 址 。TSS 是 Intel 所 提供 


的 任务 切换 机 制 ， 但 是 
2. HIT] (Inte 




















Linux 并 没有 采用 任务 门 来 进行 任务 切换 (参见 第 五 章 的 任务 切换 )。 








rupt gate) 
































其 类 型 码 为 110, | 



































断 门 包含 了 一 个 中 断 或 异常 处 理 程序 所 在 段 的 选择 符 和 上 段 内 偏 移 量 。 
































当 控 制 权 通过 中 断 门 进 入 中 断 处 理 程序 时 ,处理 器 清 IF fre, BI, DU RE DATA 
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Linux [ 


























发 生 。 中 断 门 中 的 DPL (Descriptor Privilege Level) 40, 





























Intel 的 中 断 门 。 所 有 的 中 断 处 理 程序 都 ! 















































3. BABE] (Trap gate) 




















其 类 型 码 为 111， 与 中 断 门 类 似 ， 











4. 系统 门 (System gate) 














这 是 Linux 内 核 特别 设置 的 ， 用 来 让 用 户 态 的 进程 访问 Intel 的 陷阱 门 ， 因 
符 的 DPL 为 3。 通过 系统 门 来 激活 4 个 Linux 异常 处 理 
也 就 是 说 ， 在 用 户 态 下 ， 可 以 使 用 int3、into、bound 及 int0x80 





































































































最 后 ， 在 保护 横 式 下 ， 中 断 描述 符 表 在 内 存 的 位 置 不 再 限于 从 地 址 0 开始 的 地 方 ， 而 是 
中 增设 了 一 个 中 断 描 述 符 表 寄存 器 IDTR， 用 来 存放 中 

















可 以 放 在 内 存 的 任何 地 方 。 为 此 ，CPU 
断 描述 符 表 在 内 存 的 起 始 地 址 。 中 断 














其 唯一 的 区 别 是 ， 控 制 权 通 过 
维持 IF 标志 位 不 变 ， 也 就 是 说 ， 不 关中 断 。 








程序 ， 它 们 的 



































位 保存 中 断 描述 符 表 的 大 小 ， 高 32 位 
47 
32 位 基 址 值 

















3.1.5. 相关 汇编 指令 





为 了 有 助 于 读者 对 中 断 实现 过 程 的 理解 ， 下 面 介 绍 儿 条 相关 的 汇编 指令 。 


























1. 调用 过 程 指令 CALL 


ROFI: CALL ”过 程 名 

















16 15 
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图 3. 3 IMRE Aras IDTR 


PUY 


3. 3 所 示 。 


因此 ， 用 户 态 的 进 
断 门 激活 ， 并 全 部 限制 在 内 核 态 。 














名 阱 门 进入 处 理 程 





程 不 能 访问 


























此 ， 门 描述 
a) Ste 3, 4. 5 及 128, 
CIRE 























述 符 表 寄存 器 IDTR 是 一 个 48 位 的 寄存 器 ， 
保存 IDT 的 基 址 ， 如 








HAK 16 


说 明 : 1386 在 取出 CALL 指令 之 后 及 执行 CALL 指令 之 前 ， 使 指令 指针 寄存 器 EIP 指向 紧 
接 CALL 指令 的 下 一 条 指令 。CALL 指令 先 将 EIP 值 压 入 栈 内 ， 再 进行 控制 转移 。 当 遇 到 RET 
指令 时 ， 栈 内 信息 可 使 控制 权 直 接 回 到 CALL 的 下 一 条 指令 









































2. 调用 中 断 过 程 指令 INT 


RH: INT 中断 向 量 















































说 明 : EFLAG、CS 及 EIP 寄存 器 被 压 入 栈 内 。 控 制 权 被 转移 到 由 
理 程 序 。 在 中 断 处 理 程序 结束 时 ，IRET 指令 又 把 控制 权 送 回 到 刚才 执行 被 










































































3. 调用 溢出 处 理 程 


指令 格式 : INTO 








TAES INTO 





I 











说 明 : 在 溢出 标志 为 1 PF, INTO 调用 中 断 向 量 为 4 的 异常 处 





寄存 器 被 压 入 栈 内 。 控 制 权 被 转移 到 由 








H 










































































P 断 向 量 4 指定 的 异常 处 


束 时 ，IRET 指令 又 把 控制 权 送 回 到 刚才 执行 被 中 断 的 地 方 。 
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- Å 











WTA 





ዘዘ ETE AE Hy ST cb 
FP 断 的 地 方 。 








里 程序 。EFLAG、CS 及 EIP 




















VR 











אהא .4 


指令 格式 : 
说 明 : IRE 
































回 指令 IRET 





IRET 

















T 与 中 断 调 用 过 程 相 反 : 它 将 BIP, CS 及 EFLAGS 寄存 器 内 容 从 栈 中 弹出 ， 并 
























































将 控制 权 返 回 到 发 生 中 断 的 地 方 。IRET 用 在 中 断 处 理 程序 的 结束 处 。 















































5. 加 载 


格式 : LID 
:א‎ LID 











断 描述 符 表 的 指令 LIDT 


T 48 位 的 伪 描 述 符 
































T 将 指令 中 给 定 的 48 位 伪 描 述 符 闭 入 中 断 描 述 符 寄 存 器 IDTR。 伪 描述 符 和 中 





























断 描述 符 表 寄存 器 的 结构 相同 ， 都 是 由 两 部 分 组 成 : ERF AK 16 位 ) 

















MF Gå 32 位 

















7 中 闭 的 是 基 址 。 这 条 指令 只 能 出 现在 操作 系统 的 代码 中 。 






































操作 后 ， 把 控制 权 转 交 给 被 中 断 的 进程 。 





e A 
先 弹出 这 个 值 ， 



























































中 装 的 是 界限 ， 在 高 











中 断 或 异常 处 理 程序 执行 的 最 后 一 条 指令 是 返回 指令 IRET, 这 条 指令 将 使 CPU 进行 如 下 





处 理 程序 的 内 核 栈 中 恢复 相应 寄存 器 的 值 。 如 果 一 个 便 件 错 码 被 压 入 堆栈 , 则 





























然后 ， 依 次 将 EIP, CS 及 EFLSG 从 栈 中 弹出 。 

















。 检查 
中 断 的 进程 与 

















断 或 异常 处 理 程序 的 CPL 是 否 等 于 CS 中 的 最 低 两 位 ， 如 果 是 ， 这 就 意味 着 被 











P 断 处 理 程序 都 处 于 内 核 态 ， 也 就 是 没有 更 换 堆栈 























回 到 被 中 断 的 进程 。 和 否则， 转 入 下 一 步 。 




















e MER! 

















装载 SS 和 ESP 寄存 器 ， 返 回 到 用 户 态 堆栈 。 








因此 ，IRET 终止 执行 ， 返 


e 检查 DS、ES、FS 和 GS 四 个 段 寄 存 器 的 内 容 ， 看 它们 包含 的 选择 符 是 否 是 一 个 段 选 择 





符 ， 并 且 其 DPL 是 否 小 于 CPL。 如 果 是 ， 就 清除 其 内 容 。 这 么 做 的 原因 是 为 了 禁止 





















































IPS 














程序 CCPL=3) 利用 内 核 兽 用 过 的 段 寄存 器 (DPL=0)。 如 果 不 这 么 做 ， 怀 有 恶意 的 用 户 就 可 能 
利用 这 些 寄存 器 来 访问 内 核 的 地 址 空间 。 
































3.2 中 断 描述 符 表 的 初始 化 









































台 化 可 编程 控制 器 8259A; 将 中 断 向 量 DT 表 的 起 始 地 址 装 入 IDTR 寄存 器 ， 


通过 上 面 的 介绍 ， 我 们 知道 了 Intel 微 处 理 器 对 中 断 和 异常 所 做 的 工作 。 下 面 ， 
操作 系统 的 角度 来 对 中 断 描述 符 表 的 初始 化 给 予 描述 。 
inux 内 核 在 系统 的 初始 化 阶段 要 进行 大 量 的 初始 化 工作 ， 其 与 






































我 们 从 


FP 断 相关 的 工作 有 : 初 



































每 一 项 。 这些 操 作 的 完成 将 在 本 节 进 行 具体 描述 。 












































一 就 是 将 中 断 i 










































































并 初始 化 表 中 的 


用 户 进 程 可 以 通过 INT 指令 发 出 一 个 中 断 请 求 ， 其 中 晰 请 求 向 量 在 0 一 255 ZI. AIT 
防止 用 户 使 用 INT 指令 模拟 非法 的 中 断 和 异常 ， 必 须 对 IDT 表 进 行 谨慎 的 初始 化 。 其 措施 之 





] 或 陷阱 门 中 的 DPL 域 置 为 0。 如 果 用 户 进 程 确实 发 出 了 这 样 一 个 中 断 请 求 ， 
CPU 会 检查 出 其 CPL 3) 5 DPL (O) 有 冲突 ， 因 此 产生 一 个 “通用 保护 ”异常 。 

但 是 ， 有 时 候 必 须 让 用 户 进程 能 够 使 用 内 核 所 提供 的 功能 〈 比 如 系统 调用 )， 也 就 是 说 
从 用 户 空 间 进 入 内 核 空间 ， 这 可 以 通过 把 中 断 门 或 陷阱 门 的 DPL 域 置 为 3 来 达到 。 
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Na] S TRS" ml br e H, md br az rp DT li ei LX UT Pal a OR LAYS HT PZ 
259A rh rela, Fm TR TE INE 


T 8 























[ Linux [ 























3.2.1 外 部 中 断 问 量 的 设置 


前 面 我 们 已 经 提 到 ，Linux 把 向 量 0-31 分 配给 异常 和 非 屏蔽 中 断 ， 而 把 32--47 之 间 的 























































































































来 了 解 如 何 设置 中 断 向 量 。 











~ 








8259A 通过 两 个 端口 来 进行 数据 传送 , 对 于 单 块 的 8259ለ 或 者 是 级 连 中 的 8259A_1 来 说 ， 
这 两 个 端口 是 0x20 和 0x21。 对 于 8259A 2 来 说 ， 这 两 个 端口 是 0xA0 和 OxAl. 8259A 有 两 种 



















































































先 简单 介绍 一 下 8259A 内 部 的 4 个， 





动 初始 化 编程 的 。 














ላ IWI: 初始 化 命令 字 。 








编程 方式 ， 一 是 初始 化 方式 ， 二 是 工作 方式 。 在 操作 系统 启动 时 ， 需 要 对 8959A 做 一 些 初始 
化 工作 ， 这 就 是 初始 化 方式 编程 。 














断 命令 字 〈ICW) 寄存 器 的 功能 ， 它 们 都 是 用 来 局 








e ICW2: 中 断 向 量 寄存 器 ， 初 始 化 时 写 入 高 5 位 作为 中 断 向 量 的 高 五 位 ， 然 后 在 中 断 
响应 时 由 8259 根据 中 断 源 《哪个 管 脚 ) 自动 填 入 形成 完整 的 8 位 中 断 向 量 《〈 或 叫 中 断 





类 型 号 ) 。 

















e 1003: 8259 的 级 连 命令 字 ， 








e ICW4: FERRER, BM 











] 来 区 分 主 片 和 从 片 。 








As A = 





8259A 初始 化 的 目的 是 写 入 有 关 





FVT» 


Fh 选择 、 中 断 结束 方式 和 CPU 类 型 。 
8259A 内 部 有 相应 的 寄存 器 来 锁 存 这 些 命令 字 ， 























以 控制 8259ለ 工作 。 有 关 的 硬件 知识 笔者 就 不 详细 描述 了 ， 请 读者 查阅 有 关 可 编程 中 断 控制 


器 的 资料 ， 
























































我 们 只 具体 把 Linux 对 8259 的 初始 化 讲解 一 下 ,代码 在 





/arch/i386/kernel/i8259. ር 的 函数 init 8259ለ() 中 : 
/* 送 数据 到 工作 寄存 器 OCWL CURIE) ， 





高 5 位 , 低 3 位 根据 


*/ 





outb (Oxff, 0x21) ; 





























outb (Oxff, OxAl) ; 


outb p (0x11, 0x20) 


























屏蔽 所 有 外 部 中 断 ， 因 为 此 时 系统 尚未 初始 化 完毕 ， 

















不 能 接收 任何 外 部 中 断 请 求 x/ 























; / iE 0x11 Å] ICWI (通过 端口 0x20)， 启 动 初始 化 编 
0x11 表示 外 部 中 断 请 求 信号 为 上 升 沿 有 效 ， 系 统 中 有 多 片 8295A MAE, 还 表示 要 向 ICW4 
送 数据 * / 




















outb p (0x20 + 0, 0x21) ; /ቾ 送 0x20 到 ICW2， 写 入 高 5 位 作为 中 断 向 量 的 








outb p (0x11, OxAO) 





outb p (0x02, OxAl) 
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outb p (0x04, 0x21) ; /* ፲፳ 0x04 到 ICW3, ICW3 是 8259 的 级 连 命令 
表示 8259A-1 是 主 片 */ 


; /ቹ 


outb p (0x20 + 8, OxAl) ; /* 


; fk 


PT GE AD 填 入 中 断 号 0 一 7， 因 此 把 IRQ0-7 映射 到 向 量 0x20-0x27 





, 0x04 


tt 





用 1681 初始 化 8259A-2 */ 
用 ICW2 把 8259A-2 的 IRQO-7 映射 到 0x28-0x2f 











送 0304 到 ICW3。 表 示 8259A-2 是 从 片 ， 并 连 



































HETE 8259ለ 1 的 2 号 管 脚 上 x/ 
outb p (0x01, OxAl) ; /* 把 0x01 送 到 ICW4 ቾ/ 




















最 后 一 多 有 4 方面 含义 : (Or rd RETTA. SRP PEERS, Å 
级 中 断 及 更 低级 的 中 断 都 被 屏蔽 ， 只 有 更 高 级 的 中 断 才能 响应 。 注 意 ， 这 对 于 多 片 8259A 级 



















































































连 的 中 断 系统 来 说 ， 当 某 从 方 中 一 个 中 断 正在 服务 时 ， 主 片 即将 这 个 从 片 的 所 有 中 断 屏 蔽 ， 








所 以 此 时 即使 本 片 有 比 正 在 服务 的 中 断 级 别 更 高 的 中 断 源 发 出 请 求 ， 也 不 能 得 到 响应 ， 





















































即 不 


HEP WK. (28259ለ 数据 线 和 系统 总 线 之 间 不 加 三 态 缓冲 器 。 一 般 来 说 ， 只 有 级 连 片 数 很 
多 时 才 用 到 三 态 缓冲 器 ，@@ 中 断 结束 方式 为 正常 方式 〈 非 自动 结束 方式 ) 。 即 在 中 断 服务 结 





束 时 (中 断 服 务 程 序 末尾 ) ,要 向 8259A EF REH KNB T E0I( 送 到 工作 寄存 器 0CW2 rp», 





























L 








T 
CPU 2878 x86 系列 。 




















断 服务 寄存 器 ISR 中 的 当前 服务 位 被 清 0, EOT 命令 字 的 格式 有 多 种 ,在 此 不 详 述 ; © 


outb pO 函数 就 是 把 第 一 个 操作 数 找 贝 到 由 第 二 个 操作 数 指定 的 1/0 端口 ， 并 通过 一 个 











空 操作 来 产生 一 个 暂停 。 




















这 里 介绍 了 82594 初始 化 的 主要 工作 。 最 后 要 说 明 的 是 : IBM PC 机 的 BIOS 中 国 化 有 对 






























































断 控制 器 的 初始 化 程序 段 ， 在 计算 机 加 电 时 ， 这 段 程序 自动 执行 ， 读 者 感 兴 趣 可 以 查阅 资 
料 看 看 它 的 源 代码 。 典 型 的 PC 机 将 外 部 中 断 的 中 断 向 量 分 配 为 : OSH OFH，70H 77H。 但 是 





























Linux 对 8259A 作 了 重新 初始 化 ， 修 改 了 外 部 中 断 的 中 断 向 量 的 分 配 (20H 2FH) ， 使 ， 
量 的 分 配 更 加 合理 。 























3.2.2 中 断 描述 符 表 IDT 的 预 初始 化 



































ጃጀ 


当 计 算 机 运行 在 实 模式 时 ，IDT 被 初始 化 并 由 BIOS 使 用 。 然 而 ， 一 旦 真正 进入 了 Linux 



































内 核 ，IDT 就 被 移 到 内 存 的 另 一 个 区 域 ， 并 进行 进入 实 模式 的 初步 初始 化 。 
1. 中 上 断 描 述 表 寄存 器 IDTR 的 初始 化 

















用 汇编 指令 LIDT 对 中 断 向 量 表 寄存 器 DR 进行 初始 化 ， 其 代码 在 





arch/i386/boot/setup.S rH: 





lidt idt_48 # load idt with 0,0 
idt_48: 

word 0 # idt limit = 0 

.word 0, 0 # 101 base = OL 





2. 把 IDT 表 的 起 始 地 址 装 入 IDTR 


用 汇编 指令 LIDT RA DT 的 大 小 和 它 的 地 址 (在 arch/i386/kernel/head. S 中 ): 
#define IDT ENTRIES 256 
. globl SYMBOL NAME (idt) 











lidt idt descr 


idt descr: 
.word IDT ENTRIES*8-1 8 idt contains 256 entries 
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指定 
址 装 


处 于 


igno 


edi) 
































Linux | 








SYMBOL NAME (idt) : 
. long SYMBOL NAME (idt tabl 























其 中 idt 为 一 个 全 局 变量 ， 内 核对 这 个 变量 的 引 月 
为 256x8=2048 Fi. 





e) 








3. 用 setup idt O 函数 填充 idt table 表 中 的 256 MRIN 


我 们 首先 要 看 一 下 idt table 的 定义 (在 arch/i386/kernel/traps.c P): 
struct desc struct idt_table[256] attribute ( ( section (”.data. idt”) ) ) = 10, 























desc struct 结构 定义 为 : 





struct desc struct 1 
unsigned long a,b } 




















就 可 以 获得 IDT 表 的 地 址 。 表 的 长 度 


对 idt table 变量 还 定义 了 其 属性 C attribute ), section 是 汇编 中 的 “ 节 ”， 
J idt table 的 起 始 地 址 存放 在 数据 节 的 idt 变量 中 ， 如 上 面 第 








入 IDTR” 所 述 。 
在 对 idt table 表 进 行 填充 时 ， 使 月 























初始 化 阶段 ， 还 没有 任何 中 断 处 理 程序 ， 因 此 用 这 个 空 的 中 新 处 到 





























目 了 一 个 空 的 中 断 处 理 程序 ign 









































re int () 是 一 段 汇编 程序 C E head. S FH): 














ignore int: 








%eax 

%ecx 

%edx 

%es 

%ds 

movl 8 ( KERNEL DS) , %eax 
movl %eax, %ds 








LZ 

ፎ 

2 
55 ₪2 5 D 


movi %eax, es 

pushl $int msg 

call SYMBOL NAME Cprintk) 
popl %eax 

popl 58 

popl %es 

popl %edx 

popl %ecx 

popl %eax 





int msg: 
.asciz "Unknown interrupt An^ 
ALIGN 








该 中 断 处 理 程 序 模仿 一 般 的 中 断 处 理 程序 ， 执 行 如 下 操作 : 




















。 在 栈 中 保存 一 些 寄存 器 的 值 ; 





9 调用 printk O 函数 打印 “Unknown interrupt” 系 统 信 息 ; 


-64- 








*2. JE IDT 表 的 起 始 地 





ore int 。 因 为 现在 
程序 填充 每 个 表 项 。 


cld ## 方 向 标志 清 0， 表 示 串 指令 自动 增长 它们 的 索引 寄存 器 Cesi 和 

















e MER! 


° 执行 iret 指令 以 | 
实际 上 ，ignore int 
“Unknown interrupt” 消 息 ， 说 明 要 么 是 出 现 了 一 个 硬件 问题 (一 个 1/0 设备 正在 产生 没有 
bi 现 了 一 个 内 核 问 题 (一 个 中 断 或 异常 未 被 恰当 








预料 到 的 








WT), ZDA H 





























恢复 寄存 器 的 内 容 ; 
次 复 被 中 断 的 程序 。 























O 处理 程 序 应 该 从 不 执行 。 如 果 在 控制 














或 日 志文 件 中 出 现 了 


















































地 处 理 )。 





最 后 ， 我 们 来 看 setup_idt () 函数 如 何 对 IDT 表 进 行 填充 : 


/ቾ 
* 
* 
* 
* 
* 
* 
* 
* 


*/ 
setup idt: 


lea ignore int, %edx 
ovl $ € KERNEL CS << 16) , %eax 
ovw %dx, %ax 

ovw $0x8E00, %dx 


1 


rp sidt: 


ovl %eax, 
ovl %edx, 4 (%edi) 
addl $8, 1 

dec %ecx 


setup idt 


sure everything is ok. 


(edi) 


rp sidt 











的 理解 要 对 照 门 








/ 
































edx 


图 3. 4 Bras, M 





31 








ka 











3.4 





段 选择 符 (030010) 


局 移 量 的 高 16 位 





/# 计 算 ignore int 地 址 的 1 


述 符 的 格式 。8 个 字 节 的 门 
p_sidt 开始 的 那 段 程 


sets up a idt with 256 entries pointing to 

ignore int, interrupt gates. It doesn't actually load 

16% - that can be done only after paging has been enabled 
and the kernel moved to PAGE OFFSET. 
are enabled elsewhere, when we can be relatively 


Interrupts 

















mAg, 并 将 其 装 入 %edx*/ 
/* selector = 0፳0010 = cs ቾ/ 




















* interrupt gate - dpl=0, present */ 


ea SYMBOL NAME Cidt_table) , %edi 
ov $256, %ecx 





述 符 放 在 两 个 32 位 寄存 器 eax 
序 是 循环 填充 256 个 表 项 。 


























16 15 











局 移 量 的 低 16 位 


[o fo] 00000000 _ 

















门 描述 符 存 放 在 两 个 32 位 的 寄存 器 中 














3.29 中 断 向 量 表 的 最 终 初 始 化 








EXT 





Wr 





也 就 是 说 ， 用 实际 的 陷 























述 符 表 进行 预 初始 化 后 ， 


内 核 将 在 启用 分 页 功能 后 对 IDT 进行 第 二 遍 初始 化 ， 
































All! 


I Ack HALF 











EE PRI GADE. — HX ,לצ‎ WT 
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每 个 异常 ，IDT 都 由 一 个 专门 的 陷阱 门 或 系统 门 ， 而 对 每 个 外 部 中 断 ，IDT 都 包含 专门 的 中 断 
ry. 

















里 使 用 的 是 嵌入 式 汇编 
中 ) 及 其 解释 : 





























[] [ Linux [ O | 

































































1. IDT 表 项 的 设置 
DT 表 项 的 设置 是 通过 set gaet U 函数 实现 的 ， 这 与 IDT 表 的 预 初始 化 比较 相似 , 但 这 
因此 ， 理 解 起 来 比较 困难 。 在 此 ， 我 们 给 出 函数 源码 (在 traps. c 





















































~ 








Hdefine set gate (gate addr, type, dpl,addr) ላ 


do + \ 
int dO, dl: \ 
. asm volatile  (”movw %%dx, *%ax\n\t” \ 


"movw %4, %%dx\n\t” ላ 
"movl %%eax, %0\n\t” ላ 
“movi %%edx, %1” ላ 
:”=m” (ቹ ( (long *( (gate addr) ) ( , \ 
“=m” Ck (1+ (long *( (gate addr) ) ) , ”=&a” ( በ0) , ”=&d” ( dl) N 
:/i7 ( (short) (0፪8000+ (dpl<<13) + (type<<8) 2 >, ላ 
737 C (char *) (addr) ) , 2” ( KERNEL CS << 160 כ‎ ; ላ 
} while (0) 


这 是 一 个 带 参数 的 宏 定 义 ， 其 中 ，gate_addr 是 门 的 地 址 ，type 为 门类 型 ，dpl 为 请 求 








特权 级 ，addr 为 中 断 处 理 程序 的 地 址 。 对 这 段 租 入 式 汇编 代码 的 说 明 如 下 : 

















> 输出 部 分 有 4 个 变量 , 分 别 与 %1、%2、%3 及 %4 相 结 合 ， 其 中 ，%0 与 gate addr 




















结合 ，1% 与 (gate_aggr 十 1) 结合 ， 这 两 个 变量 都 存放 在 内 存 ;， 2% 与 局 部 变量 d0 结合 ， 
存放 在 eax 寄存 器 中 ; 3% 与 ”dl 结合 ， 存 放 在 edx 寄存 器 中 。 





























e 输入 部 分 有 3 个 变量 于 输出 部 分 已 定义 了 0%~3%， 因 此 ， 输 入 部 分 的 第 一 个 变 




















量 为 4%， 其 值 为 “0x8000+ (dpl<<13) + Ctype<<8”, 而 后 面 两 个 变量 分 别 等 价 于 输出 部 分 
的 %3 Cedx) 和 2% (eax)， 其 值 分 别 为 “addr” 和 “ KERNEL CS << 16” 


了 。 






































e 有 了 参数 的 这 种 对 照 关系 ， 再 参考 前 面 的 set idtO 函数， 就 不 难 理解 那 4 条 mov 语句 








下 面 我 们 来 看 如 何 调用 _set_get O 函数 来 给 IDT 插入 门 : 


void set intr gate (unsigned int n, void *addr) 

















{ 
set gate (idt table+n, 14, 0, addr) ; 
} 
在 第 个 表 项 中 捅 入 一 个 中 断 门 。 这 个 门 的 段 选择 符 设 置 成 代码 段 的 选择 符 








C. KERNEL CS), DPL 域 设置 成 0,14 表示 D 标志 位 为 1 而 类 型 码 为 110, 所 Ll set intr gateO 
设置 的 是 中 断 门 ， 偏 移 域 设置 成 中 断 处 理 程序 的 地 址 addr. 



































static void init set trap gate (unsigned int n, void #addr) 


{ 
set gate 610% tabletn, 15,0, addr) ; 
} 


在 第 n NU AN ተ8ቹቭ(]. REST II BEE PET BE HR TC HH SEF, DPL 域 设 











FK 0, 15 表示 DD 标志 位 为 1 而 类 型 码 为 111,， 所 以 set trap gate 0 WERE BABET], m 


域 设 






































置 成 异常 处 理 程序 的 地 址 addr. 














static void init set system gate (unsigned int n, void *addr) 
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{ 
































set gate (idt table+n, 15, 3, addr) ; 


} 
在 第 了 个 表 





项 中 插入 一 个 系统 门 。 这 个 门 的 段 选择 符 设置 成 代码 段 的 选择 符 ，DPL 域 设 











置 成 3，15 表示 D 标志 位 为 1 而 类 型 码 为 111， 所 以 set system gate U 设置 的 也 是 陷阱 门 ， 


但 因为 DPL 为 3， 
入 内 核 空间 。 




















2. 对 陷阱 门 和 系统 门 的 初始 化 


trap init 0 函数 就 是 设置 中 断 描 述 符 表 开 头 的 19 个 陷阱 门 ， 如 前 所 说 ， 这 些 中 断 向 量 





























都 是 CPU 保留 用 于 异常 处 理 的 : 
set trap gate (0, &divide error) ; 
set trap gate (1, &debug) ; 
set intr gate (2, &nmi) ; 


set system gate (3, kint3) ; 





set system gate (4, &overflow) ; 
set system gate (5, &bounds) 








t trap gate 
t trap gate 
t trap gate 
t trap gate 
t trap gate 
t trap gate 
t trap gate 
t trap gate 
intr gate 
t trap gate 
t trap gate 
t trap gate 
t trap gate 
t trap gate 








(6, &invalid op) ; 

(7, &device not available) 

(8, &double fault) 

(9, &coprocessor segment overrun) ; 
(10, &invalid TSS) ; 

(11, &segment not present) 

(12, &stack segment) ; 

(13, &general protection) ; 
(14, &page fault) ; 

(18, &spurious interrupt bug) ; 
(16, &coprocessor error) ; 

(17, &alignment check) ; 

(18, &nachine check) ; 

(19, &simd coprocessor error) ; 

















set system gate (SYSCALL VECTOR, &system call) ; 


在 对 陷阱 门 及 系统 门 设置 以 后 ， 我 们 来 看 一 下 中 断 门 的 设置 。 
3. 中 断 门 的 设置 



































下 面 介绍 的 相关 代码 均 在 arch/1386/kerne1/i8259.c 文件 中 ， 
init IRQ C ) 函数 中 的 一 段 代 码 完 成 的 : 
i< NR IRQS; i++) Í 

int vector = FIRST EXTERNAL VECTOR + i; 

if (vector != SYSCALL VECTOR) 











for (i = 0; 




















set intr gate (vector, interrupt[i]) ; 



































因此 ， 系 统 调用 在 用 户 空间 可 以 通过 “INT0X80” 顺 利 穿 过 系统 门 ， 从 而 进 




















/ቾ int3-5 can be called from all */ 

















I 














中 中 断 门 的 设置 是 | 




















其 含义 比较 明显 : 从 FIRST EXTERNAL VECTOR 开始 ， 设 置 NR IRQS 个 IDT 表 项 。 常 数 


FIRST EXTERNAL VECTOR 定义 为 0x20， 而 NR IRQS 则 为 224， 即 中 断 门 的 个 数 。 注 意 ， 必 须 
跳 过 用 于 系统 调用 的 向 量 0x80， 因 为 这 在 前 面 已 经 设置 好 了 。 








这 里 ， 中 新 处 至 









































程序 的 入 口 地 址 是 一 个 数组 interrupt[]， 数 组 中 的 每 个 元 素 是 指向 中 
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[ Linux [ 








































































































































































































































































































































































































Ab FH PR BOA ETE. BARA PARE ECRIRE AP HR STE RA, MASE‏ ו 
一 的 方式 处 理 多 个 函数 名 。‏ 
#define IRQ (x,y) ላ‏ 
IRQ##x##y## interrupt‏ 
#define IRQLIST 16 (x) ላ‏ 
RQ G0), IRQ (x, 1) , IRQ (x,2) , IRQ (x,3), \‏ 
RQ (፳, 4) , IRQ (፳,5) , IRQ (x,6) , IRQ (x,7), \‏ 
RQ (x,8) , IRQ (x,9) , IRQ (x,a), IRQ a,b), \‏ 
RQ (x c), IRQ (xd) , IRQ (x,e) , IRQ (x, £D‏ 

void (*interrupt[NR_IRQS]) (void) = IRQLIST 16 (0x0) 

Hoh, “HH” WE HH IS HERE i. Zid gcc 预 处 理 ，IRQLIST 16 (030) 被 
ig IRQOx00 interrupt, 01א00א1‎ interrupt, IRQ0x02 interrupt***IRQOxOf interrupt. 

到 此 为 止 ， 我 们 已 经 介绍 了 15 个 陷阱 门 、4 个 系统 门 和 16 个 中 断 门 的 设置 。 内 核 代 码 
中 还 有 对 其 他 中 断 门 的 设置 ， 在 此 就 不 一 一 介绍 。 

3.3 FRE 

Linux 利用 异常 来 达到 两 个 截然 不 同 的 目的 : 

。 给 进程 发 送 一 个 信号 以 通报 一 个 反常 情况 ; 

e 处 理 请 求 分 页 。 

对 于 第 一 种 情况 ， 例 如 ， 如 果 进 程 执行 了 一 个 被 0 除 的 操作 ，CPU 则 会 产生 一 个 “除法 
错误 ”异常 ， 并 由 相应 的 异常 处 理 程序 向 当前 进程 发 送 一 个 SIGFPE 信和 号。 当前 进程 接收 到 这 
个 信号 后 ， 就 要 采取 若干 必要 的 步骤 ， 或 者 从 错误 中 恢复 ， 或 者 终止 执行 《如 果 这 个 信号 没 
有 相应 的 信号 处 理 程 序 )。 

内 核对 异常 处 理 程序 的 调用 有 一 个 标准 的 结构 ， 它 由 以 下 3 部 分 组 成 : 

° 在 内 核 栈 中 保存 大 多 数 寄存 器 的 内 容 《〈 由 汇编 语言 实现 ); 

e 调用 C 编写 的 异常 处 理 函 数 ; 

e 通过 ret from exception) 函数 从 异常 退出 。 

3.3.1 在 内 核 栈 中 保存 寄存 器 的 值 

所 有 异常 处 理 程序 被 调用 的 方式 比较 相似 ， 因 此 ， 我 们 用 handler name 来 表示 一 个 通 
HI MG FE RB 里 程序 的 汇编 指令 在 


























e: 


VERE SRE וא‎ 3.1 中 )。 进 入 异常 处 
arch/1386/kernel/entry.S rH: 


handler na 


pushl $0 /ቾ only for some exceptions ቾ/ 
pushl $do handler name 
jmp error code 


例如 : 
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overflow: 


pushl $0 



























































pushl $ do overflow 


当 异 常 发 生 时 ， 如 果 控 制 单元 没有 
语言 片段 会 包含 一 条 pushl $0 指 
没有 这 条 指令 。 然后 , 把 异常 处 理 函 数 的 地 址 压 进 栈 中 , 函数 的 名 字 由 


前 绥 组 成 。 


jmp error_code 











ቀ, 














T 














动 地 把 一 个 硬件 错误 代码 插入 到 栈 中 ， 相 应 的 汇编 
垫上 一 个 空 值 ， 如 果 错 误 码 已 经 被 压 入 堆栈 ， 则 






































异常 处 理 程序 名 与 do_ 











标号 为 error code 的 汇编 语言 片段 对 所 有 的 异常 处 理 程序 都 是 相同 的 ， 除 了 “设备 不 


可 用 ”这 一 个 异常 。 这 段 代码 实际 上 是 为 异常 处 型 


如 下 : 





error_code: 


图 3.5 给 出 了 从 


pus 


OV 








GET 

cal 

add 
jmp 


h 
1 


8] 


ከ 
ከ 
1 


በ 








በ1 


hl 


hl 


%ds 

1 %eax 
%eax, %eax 
1 %ebp 
%edi 

1 1 

1 %edx 
%eax 

1 %ecx 
%ebx 





# 





=< 


%es, %ecx 
ORIG EAX (%esp) 
ES (%esp) , %edi 


%eax, ORIG EAX (%esp) 


%ecx, ES (%esp) 
%esp, %edx 


pushl %esi 
pushl %edx 




















程序 的 调用 和 返回 





进行 相关 的 操作 ， 代 码 








HJE C 函数 可 能 





Heax = 1 

















%esi 








ግጥ 








到 的 寄存 器 都 保存 在 栈 中 





清 eflags 的 方向 标志 ， 以 确保 edi 和 esi 寄存 器 的 值 自动 增加 


# get the error code, ORIG EAX= 0x24 
# get the funct 
t Hp ME 


ion address, ES - 0x20 


为 -| 





























# push the error code 
# push the pt_regs pointer 


$ C KERNEL DS) , %edx 
# 把 内 核 数据 段 选择 符 装 入 ds 寄存 器 


%edx, %ds 
%edx, %es 


CURRENT (%ebx ) 


*%edi 
$8, %esp 
et from exception 





























tt ebx 中 存放 当前 进程 task_struct 结构 的 地 址 














H iji 


























] 户 进程 进入 异常 处 理 程序 时 内 核 堆栈 的 变化 示意 


Hi Pon AL BB y: 
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内 核 堆栈 指针 ESP 
| 
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堆栈 指针 ESP 
































Linux 






























































































































































+0x38 JFR SS 
+0x34 用 户 栈 的 ESP 
+0x30 EFLAGS 
+0x2C 用 户 空间 的 CS 
+0x28 EIP 
+0x24 错误 码 或 0 
+0x20 函数 地 址 
+0x1C DS 
+0x18 EAX 
+0x14 EBP 
+0x10 EDI 
+0XC ESI 
+8 EDX 
+4 ECX 
0 EBX 
(a) 进入 异常 处 理 程 序 时 内 核 堆栈 示意 
+0x38 用 户 栈 的 SS f 
+0x34 HUI ESP 用 
+0x30 EFLAGS 
+0x2C 用 户 空 间 的 CS 
返 
+0x28 EIP 
+0x24 -1 
+0x20 ES 
+0x1C DS 
+0x18 EAX 
+0x14 EBP 
+0x10 EDI 
+0XC ESI 
+8 EDX 
+4 ECX 
0 EBX 
HAN 
ESP 
(b) 异常 处 理 程序 被 调用 后 堆栈 的 示意 图 





图 3.5 























进入 异常 后 内 核 堆 栈 的 变化 





























到 用 








888 














回 到 用 户 态 的 地 址 


EERIE EF 





户 态 的 地 址 
































3.3.2 中 断 请 求 队列 的 初始 化 





由 于 硬件 的 





















































民 制 ， 很 多 外 部 设备 不 得 不 共享 中 断 线 ， 例 如 ， 一 些 PC 配置 可 以 把 同一 条 
断 线 分 配给 网 卡 和 图 形 卡 。 由 此 看 来 ， 让 每 个 中 断 源 都 必须 占用 一 条 中 断 线 是 不 现实 的 。 



































所 以 ， 仅 用 中 断 描述 符 表 并 不 能 提供 中 断 产 生 的 所 有 信息 ， 内 核 必须 对 中 断 线 给 出 进一步 的 





描述 。 在 Linux wit! 





请 求 队 列 。 


TER, Fr, d 





























， 专 门 为 每 个 中 断 请 求 IRQ 设置 了 一 个 队列 ， 这 就 是 我 们 所 说 的 中 断 
































PAR (IRO 号 及 中 断 向 量 之 间 的 关系 为 : 中断 线 是 中 断 请 求 的 一 























种 物理 描述 ， 风 辑 上 对 应 一 个 中 断 请 求 号 (或 简称 中 断 号 )， 第 了 个 中 断 号 GIRON) 的 缺 省 中 








断 向 量 是 n+32。 























3.3.3 中 断 请 求 队列 的 数据 结构 


如 前 所 述 ， 在 256 个 中 断 向 量 中 ， 除 了 32 个 分 配给 异常 外 ， 还 有 224 个 作为 中 断 向 量 。 
1 “ት irq desc t 数据 结构 来 描述 ,我们 把 它 叫 做 IRQ 描述 符 ，224 
个 IRQ 形成 一 个 数组 irq_desc[] ， 其 定义 在 /include/linux/irq.h F: 


对 于 每 个 IRQ, Linux 都 


/ቾ 



















































































This is the “IRQ descriptor”, which contains various information 


about the irq, 


Pad this out to 32 by 


*/ 


typedef struct [ 
unsigned int sta 


hw_ 


st 


irq controller 


uct irqaction 


unsigned int dep 


sp 
} cache 





inlock_t lock; 


ine_aligned i 


* 

* including what kind of hardware handling it has, 
* whether it is disabled etc etc 
* 

* 





tes for cache and indexing reasons 





tus; /* IRQ status */ 
*handler; 

*action; /* IRQ action list */ 

(ከ; /* nested irq disables */ 

rq desc t; 


extern irq desc t irq desc [NR IRQS]; 


编码 作者 对 这 个 数据 结构 给 出 了 一 定 的 解释 ，“ 





cacheline aligned” 表 示 这 个 数据 























ND 














结构 的 存放 按 32 字 节 (高 速 缓存 行 的 大 小 ) 进行 对 齐 ， 以 便于 将 来 存放 在 高 速 缓存 并 容易 存 








取 。 下 面 对 这 个 数据 结构 的 各 个 域 给 予 描述 。 


status 























述 IRQ! 
函数 中 介绍 。 
handler 





























断 线 状态 的 一 组 标志 《在 ira. h FESO ,其 具体 含义 及 应 用 将 在 do TRIO 











指向 hw interrupt type 描述 符 ， 这 个 描述 符 是 对 中 断 控制 器 的 描述 ， 下 面 会 给 出 其 体 


解释 。 


action 









































指向 一 个 单 向 链表 的 指针 ， 这 个 链表 就 是 对 中 断 服务 例 程 进行 描述 的 irqaction 结构 ， 











后 面 将 给 予 具 体 描述 。 














= 15 














O OI Linux | 























depth 

如 果 启 用 这 条 IRQ HR, depth 则 为 0， 如 果 禁 用 这 条 IRQ 中 断 线 不 止 一 次 ， 则 为 一 
NEZ. HAA disable ira C )， 该 函数 就 对 这 个 域 的 值 加 1; 如 果 depth 等 于 0, 
该 函数 就 禁用 这 条 IRQ 中 断 线 。 相 反 ， 每 当 调用 enable ira ( ) 函数 时 ， 该 函数 就 对 这 个 
域 的 值 减 1; 如 果 depth 变 为 0， 该 函数 就 启用 这 条 IRQ 中 断 线 。 


1. IRO 描述 符 的 初始 化 



















































































在 系统 初始 化 期 间 ，init_ISA_irqs O 函数 对 IRQ 数据 结构 〈 或 叫 描述 符 ) 的 域 进行 初 
始 化 (参见 18258. c): 
for Gi = 0; i < NR IRQS; i++) I 
irq desc[i]. status = IRQ DISABLED: 
irq desc[i]. action = 0; 
ira desc[i]. depth = 1; 











if (1 ረ 16) { 


/ቾ 
* 16 old-style INTA-cycle interrupts: 
*/ 
ira desc[i]. handler = 618259 irq type; 
} else { 
/ቾ 
* ‘high’ PCI IRQs filled in on demand 
*/ 


ira desc[i]. handler = &no irq type; 
} 
} 


从 这 段 程序 可 以 看 出 ， 初 始 化 时 ， 让 所 有 的 中 断 线 都 处 于 禁用 状态 ;每 条 中 断 线 上 还 没 
有 任何 中 断 服务 例 程 Caction NO), 因为 中 断 线 被 禁用 ， 因 此 depth 为 1; 对 中 断 控 制 器 的 
描述 分 为 两 种 情况 ， 一 种 就 是 通常 所 说 的 8259A， 另 一 种 是 其 他 控制 器 。 

然后 , 更 新 中 断 描 述 符 表 IDT, 如 3. 2. 3 节 所 述 , 用 最 终 的 中 断 门 来 代替 临时 使 用 的 中 断 门 。 
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2. ןשי‎ aS MK ff hw interrupt type 
































这 个 描述 符 包含 一 组 指针 ， 指 问 与 特定 中 断 控制 器 电路 (PIC》〉 打 交道 的 低级 1/0 例 程 ， 
定义 如 下 : 
/* 
* Interrupt controller descriptor. This is all we need 
* to describe about the low-level hardware 
*/ 
struct hw interrupt type { 
const char * typename; 
unsigned int (*startup) (unsigned int irq) ; 
void (*shutdow Cunsigned int irq) ; 
void (*enable) (unsigned int irq) ; 
void (disable) (unsigned int irq) ; 
void (*ack) (unsigned int irq) ; 
void (*end) (unsigned int irq) ; 





- 











5 ጋሙ 
































void (*set_affinity) (unsigned int irq, unsigned long mask) ; 


ኦነ 


typedef struct hw interrupt type hw irq controller; 














Hes, tl SMP 








Linux 除了 支持 本 章 前 面 已 提 到 的 82594 芯片 外 ， 也 支持 其 他 的 PIC | 


TO-APIC. PIIX4 的 内 部 8259 PIC 及 SGI IN Visual Workstation Cobalt (10-) APIC. {H 
是 ， 为 了 简单 起 见 ， 我 们 在 本 章 假 定 ， 我 们 的 计算 机 是 有 两 片 8259A PIC 的 单 处 理 机 ， 它 提 



















































































域 指 向 8259A_irq type 变量 。 对 其 进行 如 下 的 初始 化 : 
struct hw interrupt type 182594 irq type = I 

“XT-PIC”, 

startup 8259A 1ፐባ 
shutdown 8259A irq 
do 8259A IRQ, 
8 
በ 











nable 8259A irq 
188016 82592 irq 
T 


GE 16 个 标准 的 IRQ. 在 这 种 情况 下 , 16 ተ irq desc t 描述 符 , 其 中 每 个 描述 符 的 handler 


在 这 个 结构 中 的 第 一 个 域 “XT-PIC” 是 一 个 名 字 。 接 下 来 ，8259A_irq_type 包含 的 指针 
指向 5 个 不 同 的 函数 ， 这 些 函 数 就 是 对 PIC 编程 的 函数 。 前 两 个 函数 分 别 启动 和 关闭 这 个 世 
片 的 中 断 线 。 但 是 , 在 使 用 8259A 芯片 的 情况 下 ， 这 两 个 函数 的 作用 与 后 两 个 函数 是 一 样 的 ， 
后 两 个 函数 是 启用 和 禁用 中 断 线 。 后 面 在 对 do IRQ 描述 时 具体 描述 do 8259A IRQ ( ) PA 





































































































数 。 
3. 中 断 服 务 例 程 描述 符 irqaction 





























在 IRQ 描述 符 中 我 们 看 到 指针 action 的 结构 为 irqaction, 它 是 为 多 个 设备 能 共享 一 条 

















中 断 线 而 设置 的 一 个 数据 结构 。 在 include/linux/interrupt. h 中 定义 如 下 : 
struct irqaction 1 
void (*handler) (int, void *, struct pt regs *) ; 
unsigned long flags; 
unsigned long mask; 
const char *name; 
void *dev_id; 
struct irgaction *next; 





ks 
这 个 描述 符 包 含 下 列 域 。 
handler 




















指向 一 个 县 体 1/0 设备 的 中 断 服务 例 程 。 这 是 允许 多 个 设备 共享 同一 中 断 线 的 关键 域 。 





flags 
用 一 组 标志 描述 
SA_INTERRUPT 

中 断 处 理 程序 必须 以 禁用 中 断 来 执行 。 
SA_SHIRQ 

该 设备 允许 其 中 断 线 与 其 他 设备 共享 。 
SA SAMPLE RANDOM 























BRS 1/0 设备 之 间 的 关系 。 




























































































可 以 把 这 个 设备 看 作 是 随机 事件 发 生源 ， 因 此 ， 内 核 可 以 用 它 做 随机 数 产 生 器 《用户 可 


293. 


以 从 /dev/ 


SA_PROBE 





内 核 在 执行 硬件 设备 探测 时 正在 使 月 


name 


1/0 设备 名 ( 读 取 /proc/interrupts 文件 ， 



































Linux | 

















H 











andom #ll/dev/urandom 设备 文件 中 取得 随机 数 而 访问 这 种 特征 )。 


这 条 中 断 线 。 


WY 

















可 以 看 到 ， 在 列 出 

















dev_id 
指定 1/0 设备 的 主 设备 号 和 次 设备 号 。 
next 
指向 irqaction 描述 符 链表 的 下 一 个 





WA 




















PTR Pl 
4. HR SG ØYE 





























元 素 。 








mi 


fE 


EX 












































































































































链表 中 的 每 个 元 素 就 是 对 相应 设备 及 ， 











断 号 时 也 显示 设备 名 )。 








WS VE 








的 描述 。 














* 享 同一 中 断 线 的 每 个 硬件 设备 都 有 其 对 应 


































































































































































































我 们 这 里 提 到 的 中 断 服 务 例 程 (Interrupt Service Routine) 与 以 前 所 提 到 的 中 断 处 
理 程序 (Interrupt handler) 是 不 同 的 概念 。 有 具体 来 说 ， 中 断 处 理 程序 相当 于 某 个 中 断 向 量 
的 总 处 理 程序 ， 例 如 IRQOx05_interrupt(), ， 是 中 断 号 5 (MED 37) 的 总 处 理 程序 ， 如 果 
这 个 5 号 中 断 由 网 卡 和 图 形 卡 共享 ， 则 网 卡 和 图 形 卡 分 别 有 其 相应 的 中 断 服务 例 程 。 每 个 中 
断 服务 例 程 都 有 相同 的 参数 : 

IRQ: TS: 

dev id: 设备 标识 符 ， 其 类 型 为 voidx*; 

S 堆栈 中 存放 的 是 中 断 发 生 后 所 保存 的 寄存 器 ， 有 关 
pt_regs 结构 的 具体 内 容 将 在 后 面 介 

在 实际 中 ， KN E LBW 

3.3.2 中 断 请 求 队列 的 初始 化 

在 IDT 表 初 始 化 完成 之 初 ， 每 个 中 断 服 务 队 列 还 为 衬 。 此 时 ， 即 使 打开 中 断 且 某 个 外 设 
中 断 真 的 发 生 了 ， 也 得 不 到 实际 的 服务 。 因 为 CPU 虽然 通过 中 断 门 进入 了 某 个 中 断 向 量 的 总 
处 理 程序 ， 例 如 IRQOx05 interrupt), 但是， 具体 的 中 断 服务 例 程 (如 图 形 卡 的 ) 还 没有 
挂 入 中 断 请 求 队列 。 因 此 ， 在 设备 驱动 程序 的 初始 化 阶段 ， 必 须 通 过 request irq O mër 
































对 应 的 中 断 服 务 例 程 挂 入 中 断 请 求 队列 。 





request 


x 


K > € * Xx XxX SE X Kk Xx X haa 


| 
I 
IN 
| 











request_irq - allocate an in 


@irq: Interrupt line to al 


@handler: Function to be call 
rupt type flags 


@irqflags: Inter 
@devname: An asci 


@dev_id: A cookie passed bac 


i name fo 


This call allocat 





es interrupt 








 irqO 函数 的 代码 在 / arch/i386/kernel/irg. ር rH: 


terrupt line 


ocate 


ed when the IRQ occurs 


the claiming device 
k to the handler function 


resources and enables the 


interrupt line and IRQ handling. From the point this 





call is made your handler 


your handler function must 1 


function may be invoked. Since 





ear any interrupt the board 





























raises, you must take care both to initialise your hardware 
and to set up the interrupt handler in the right order. 





Dev_id must be globally unique. Normally the address of the 
device data structure is used as the cookie. Since the handler 
receives this value it makes sense to use it 





If your interrupt is shared you must pass a non NULL dev_id 
as this is required when freeing the interrupt 


Flags: 

SA SHIRQ Interrupt is shared 

SA INTERRUPT Disable local interrupts while processing 
SA SAMPLE RANDOM The interrupt can be used for entropy 





int request irq (unsigned int irq 
void (*handler) (int, void *, struct pt regs *) 
unsigned long irqflags 
const char * devname, 
void *dev_id) 


int retval; 
struct irqaction * action; 


if I 
/ቾ 
* Sanity-check: shared interrupts should REALLY pass in 
* a real dev-ID, otherwise we 11 have trouble later trying 
* to figure out which interrupt is which (messes up the 
* interrupt freeing logic etc) . 
*/ 
if 617011888 & SA SHIRQ) (I 
if (!dev id) 
printk(”Bad boy: %s Cat 0x%x) called us without a dev_id!\n”, devname, 
(&irq) [-1]) 
} 


Hendif 
if (irq >= NR IRQS) 
return -EINVAL; 
if (!handler) 
return -EINVAL; 
action = (struct irqaction *) 


kmalloc (sizeof (struct irgaction) , GFP KERNEL) ; 
if (laction) 
return —ENOMEM; 


-75-- 























Linux [ 




















action->handler = handler; 

action->flags = irqflags: 

action->mask = 0; 

action->name = devname; /ቾች! action 进行 初始 化 */ 
action-2next = NULL; 

action->dev id = dev id; 














retval = setup irq (irq, action) ; 
if (retval) 

kfree (action) ; 
return retval; 


} 

编码 作者 对 此 函数 给 出 了 比较 详细 的 描述 。 其 中 主要 语句 就 是 对 setup irq U 函数 的 调 
， 该 函数 才 是 真正 对 中 断 请 求 队列 进行 初始 化 的 函数 (有 所 简化 ): 

int setup irq (unsigned int irq, struct irqaction * new) 


{ 























CN 























int shared = 0; 

unsigned long flags; 

struct irqaction Sold, **p; 

irq desc t *desc = irq desc + irq; / * 获 得 ira 的 描述 符 * / 





























/ቾ 对 中 断 请 求 队列 的 操作 必须 在 临界 区 中 进行 / 
spin lock 1208870 (&desc->lock, flags) ; /* 进 入 临界 区 * / 
p = &desc->action; / *ibp 指向 ira 描述 符 的 action Ik, BN irqaction 链表 的 首部 * / 
if (Cold = xp) != NULL) | 7/# 如 果 这 个 链表 不 为 空 * / 
/ቾ Can t share interrupts unless both agree to ቾ/ 
if (! (old->flags & new->flags & SA SHIRQ) ( I 
spin unlock irqrestore (&desc->lock, flags) ; 
return —EBUSY; 





















































} 





/* 把 新 的 中 断 服 务 例 程 加 入 到 ira 中 断 请 求 队列 #/ 








do [ 
p = &old->next; 
old = *p; 
} while (old) ; 
shared = 1; 
} 
xp = new; 
if (!shared) { L'ETÉ ira 不 被 共享 x / 





























desc-?depth = 0; / * 启 用 这 条 ira 线 * / 
desc->status &= ^ (IRQ DISABLED | IRQ AUTODETECT | IRQ WAITING) ; 
desc-^handler-^startup (irq) ; / *B HY startup 8259 irq x / 

















} 




















spin unlock irqrestore (&desc->lock, flags) ; / *iB tls A pes / 
register irq proc (irq) ; / *fE proc 文件 系统 中 显示 ira 的 信息 * / 
return 0; 


7 
































} 

下 面 我 们 举例 说 明 对 这 两 个 函数 的 使 用 。 

1. 对 register_irq( 函数 的 使 用 

在 驱动 程序 初始 化 或 者 在 设备 第 一 次 打开 时 ， 首 先 要 调用 该 函数 ， 以 申请 使 用 该 irq。 
其 中 参数 handler 指 的 是 要 挂 入 到 中 断 请 求 队列 中 的 中 断 服 务 例 程 。 假 定 一 个 程序 要 对 / 
dev/fd0/( 第 一 个 软盘 对 应 的 设备 ) 设备 进行 访问 ， 有 两 种 方式 ， 一 是 直接 访问 / dev/fd0/, 
另 一 种 是 在 系统 上 安装 一 个 文件 系统 , 我 们 这 里 假定 采用 第 一 种 。 通 常 将 IRQ6 分 配给 软盘 控 
制 器 ， 给 定 这 个 中 断 号 6， 软 盘 驱 动 程序 就 可 以 发 出 下 列 请 求 ， 以 将 其 中 断 服 务 例 程 挂 入 中 
TER BA a. 














































































































request_irq (6, floppy_interrupt 
SA_INTERRUPT|SA SAMPLE RANDOM, “floppy”, NULL) ; 


我 们 可 以 看 到 ，floppy_interrupt O 中 断 服 务 例 程 运 行 时 必须 禁用 中 断 〈 设 置 了 
SA INTERRUPT 标志 )， 并 且 不 允许 共享 这 个 IRQ (፲፻ SA SHIRQ 标志 )。 

在 关闭 设备 时 ， 必 须 通过 调用 free ira U 函数 释放 所 申请 的 中 断 请 求 号 。 例 如 ， 当 软盘 
操作 终止 时 (或 者 终止 对 / dev/fd0/ 的 1/0 操作 ， 或 者 御 载 这 个 文件 系统 )， 驱 动 程序 就 放弃 
这 个 中 断 号 : 

free_irq (6, NULL) ; 


2. ፳፲ setup irqO 函数 的 使 用 


在 系统 初始 化 阶段 ， 内 核 为 了 初始 化 时 钟 中 断 设备 irq0 描述 符 , 在 time init ( ) PE 
数 中 使 用 了 下 面 的 语句 : 
struct irqaction 1200 = 
(timer interrupt, SA INTERRUPT, 0, “timer”, NULL,): 
setup irq (0, &irq0) ; 
首先 ， 初 始 化 类 型 为 irgaction 的 1700 变量 ， 把 handler 域 设 置 成 timer interrupt 
ር ) 函数 的 地 址 ，flags 域 设置 成 SA INTERRUPT, name 域 设置 成 “timer”， 最 后 一 个 域 设置 
成 NULL 以 表示 没有 用 dev id 值 。 接 下 来 ， 内 核 调用 setup x86 irq ( ), 把 irq0 插入 到 
IRQO 的 中 断 请 求 队列 : 
类 似 地 ， 内 核 初始 化 与 IRQ2 和 18013 相关 的 irqaction 描述 符 ， 并 把 它们 插入 到 相应 
的 请 求 队列 中 ， 在 init IR C ) 函数 中 有 下 面 的 语句 : 
struct irqaction 1202 = 
{no action, 0, 0, “cascade”, NULL, }; 
struct irgaction 12018 = 
{ math error ira, 0, 0, “fpu” NULL,): 
setup x86 irq (2, &irg2) ; 
setup 86 irq (13, &irql3) ; 


















































































































































































































































3.4 中 断 处 理 


























通过 上 面 的 介绍 ， 我 们 知道 了 中 断 描 述 符 表 已 被 初始 化 ， 并 具有 了 相应 的 内 容 ， 对 于 外 
























































JT. 
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H > PS H H 
፲ 1 


寄存 器 的 最 低 两 
就 产生 一 个 “ 通 


D 














3.4.1 





rH BERI Kp 3 AF 


首先 , 我 们 从 硬件 的 角 
已 从 实 模式 转 至 





断 ， 中 断 请 求 队列 也 已 建立 。 但 
正 是 我 们 本 节 要 关心 的 主要 内 容 























Linux [ 


























是 ， 
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的 硬件 处 理 。 














| 保护 模式 。 


度 来 看 CPU 如 何 处 到 








ps 


H 























理 程 序 并 没有 执行 ， 如 何 执行 





P Br ME REP 


























中 断 和 有 异常 。 这 里 假定 内 核 








已 被 初始 化 ，CPU 





当 CPU 执行 了 当前 指令 之 后 , CS Al ETP 这 对 寄存 器 中 所 包含 的 内 容 就 是 下 一 条 将 要 执行 






































[。 在 对 下 一 条 指令 执行 前 ，CPU 
BREE. MARKET AH 





Tu 








角 定 所 发 生 中 断 或 异常 的 向 量 7 CÓ 
通过 IDTR 寄存 器 找到 

















分 








PL， 





产生 


序 运 行 在 内 

















两 步 进行 有 效 性 检查 : 





PE EI ve 
TURE 
























































A 


H 


日 户 堆 栈 切 换 
tik, wB 
































检查 是 否 发 生 了 特权 级 的 变化 。 当 
核 态 (特权 级 为 0)， 特 权 级 发 生 了 变化 ， 所 以 会 引起 











到 内 核 堆栈 。 而 当中 
3. 6 HA. 


与 IDT 中 第 7 项 段 选择 符 !‏ כ 
用 保护 ”异常 (中断‏ 
断 的 程序 的 特权 级 。 这 种 情况 发 生 的 可 能 怕‏ 
特权 级 为 0。 然 后 是 “ 门 ”级 检查 ， 才‏ 
也 就 是 当前 特权 级 〈3) 小 于 这 个 门 的 特权 级 C0), CPU‏ 









































向 量 13), 
ERK, 





7 








AI Ag rn Br ALE 








比较 ， 如 














R DPI 








E 要 判断 在 执行 当前 指令 的 过 程 中 是 否 发 生 
那么 CPU 将 做 以 下 事情 。 
E 0--255 之 间 )。 
| IDT 表 ， 读 取 IDT 表 第 7 项 (或 叫 第 7 个 门 )。 
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L (3) 大 于 CPL (0)， 











LE 程序 的 特权 级 不 能 低 于 引起 中 








EE 














E 











E CPL 5 IDT '! 





ተ BHRI” AR BAN TER 
ER, DUM "DI" Deere ET THR HU EE, ma 
ABR Mr ZE D kr, id, MARAE TH 


























HI 


] 户 应 用 程序 访问 























PURA 














中 断 处 理 程序 的 ] 


፳፪ NEO 





EFLAGS 


E 


S 
ERROR CODE 

















Q@ 特权 发 生 了 变化 
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栈 的 更 换 。 也 就 是 说 ， 从 
E 在 内 核 态 时 ， 即 CPU 在 内 核 中 运行 时 ， 则 不 会 更 换 
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CS 
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ERROR CODE 











Q 特权 级 没有 变化 
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日 户 态 堆栈 的 值 压 入 中 





















































， 同 时 把 «ለ65 寄存 器 自动 压 栈 ， 然 后 把 被 ! 程 的 返回 地 址 压 入 
F 错 误 码 ， 则 将 它 也 保存 在 堆栈 中 。 如 果 特 权 级 没有 发 生变 化 ， 
问 ， 现 在 SS:ESP 和 CS:EIP 这 
是 什么 ? SS:ESP 的 值 从 当前 进程 的 TSS PIG, th 
中 断 处 理 程序 成 为 当前 进程 的 一 部 分 ， 代 表 当 前 进程 在 运行 。C 























WEE AU PA ASHE BG HP 
3:8. HHR KR ET ONE 
则 压 入 栈 中 的 内 容 如 图 3.6 中 @。 你 可 能 要 



























































述 符 的 段 选择 符 和 偏 移 量 的 值 ， 此 时 ， 
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3.4.2 Linux 对 中 断 的 处 理 





































































































上 面 给 出 了 硬件 对 异常 和 中 断 进行 处 理 
理 ， 具 体 的 实现 过 程 将 在 后 面 介绍 。 

当 一 个 中 断 发 生 时 ， 并 不 是 所 有 的 操作 
放 进 中 断 处 理 程序 本 身 并 不 合适 。 
处 理 程 序 正 在 运行 时 ， 相 应 的 189 中 断 线 上 
理 程序 是 代表 进程 执行 的 ， 它 所 
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是 获得 当前 进程 的 内 核 栈 指针 ,， 因 
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具有 相同 的 急迫 性 。 事 实 上 ， 


E 要 的 操作 应 该 推 后 ， 
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面 将 概要 描述 Linux 对 


S:EIP 的 值 就 是 IDT 表 中 第 i 
Wi AEH 
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FP 断 的 处 


把 所 有 的 操作 都 
因为 当 一 个 中 断 























发 出 的 信号 就 会 被 忽略 。 更 习 


\ 表 的 进程 必须 总 处 于 TASK RUNNING 状态 ,否则 
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现 系 统 僵 死 情形 。 因 此 , AR 
把 一 个 中 断 要 执行 的 操作 分 为 下 面 的 3 JE. 
























































序 不 能 执行 任何 阻 

















过 程 , 如 1/0 设备 操作 。 因 
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1. KAM (Critical) 

这 样 的 操作 诸如 : 中 断 到 来 时 中 断 控 制 器 做 出 应 答 , 对 中 断 控制 器 或 设备 控制 器 重新 编程 ， 
或 者 对 设备 和 处 理 器 同时 访问 的 数据 结构 进行 修改 。 这 些 操作 都 是 紧急 的 , 应 该 被 很 快 地 执行 ， 
也 就 是 说 ， 紧 急 操作 应 该 在 一 个 中 断 处 理 程 序 内 立即 执行 ， 而 且 是 在 禁用 中 断 的 状态 下 。 

2. 非 紧 急 的 (Noncritical) 

这 样 的 操作 如 修改 那些 只 有 处 理 器 才 会 访问 的 数据 结构 (例如 , 按 下 一 个 键 后 , 读 扫描 码 )。 
这 些 操 作 也 要 很 快 地 完成 ， 因 此 ， 它 们 由 中 断 处 理 程 序 立 即 执行 ， 但 在 启用 中 断 的 状态 下 。 

3. 非 紧 急 可 延迟 的 (Noncritical deferrable) 

这 样 的 操作 如 ， 把 一 个 缓冲 区 的 内 容 找 贝 到 一 些 进 程 的 地 址 空间 〈 例 如， 把 键盘 行 缓冲 
区 的 内 容 发 送 到 终端 处 理 程序 的 进程 )。 这 些 操 作 可 能 被 延迟 较 长 的 时 间 间 隔 而 不 影响 内 核 操 























fE: 有 兴趣 的 进程 会 等 待 需要 的 数据 。: 
halves) 的 函数 来 执行 。 我 们 将 在 后 面 讨论 
所 有 的 中 断 处 









































ላ 给 与 IR ןי‎ 
Brisk: 

执行 共享 这 个 IRQ 的 所 有 设备 的 
DE ret from intr ( 
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可 延迟 的 操作 | 


“下 半 部 分 ”。 











里 程序 都 执行 4 个 基本 的 操作 : 
在 内 核 栈 中 保存 IRQ 的 值 和 寄存 器 的 内 容 ; 
bl GE PN, 这 将 允许 在 这 条 中 断 线 上 进一步 发 


断 服务 例 程 〈ISR ); 
) 的 地 址 后 终止 。 





一 些 被 称 为 “下 





RR ל‎ ” (bottom 
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Ol Linux [ [] [ 
3.43 与 堆栈 有 关 的 常量 、 数 据 结构 及 宏 


在 中 断 、 异 常 及 系统 调用 的 处 理 中 ， 涉 及 一 些 相 关 的 常量 、 数 据 结 构 及 宏 ， 在 此 先 给 予 
(大 部 分 代码 在 arch/i386/kernel/entry.S HH). 

























































































1. 常量 定义 
下 面 这 些 常量 定义 了 进入 中 断 处 理 程序 时 ， 相 关 寄 存 器 与 堆栈 指针 (ESP〉 的 相对 位 置 ， 
图 3.7 给 出 了 在 相应 位 置 上 所 保存 的 寄存 器 内 容 。 



















































































































































































用 户 栈 的 SS 
PI JE ES To E 
FJ Kf] ESP 用 户 堆栈 指针 
EFLAGS 
用 户 空间 的 CS EEN 
返回 到 用 户 态 的 地 址 
EIP 
ORIG_EAX 

ES 

DS 

EAX 

EBP 

EDI 

ESI 

EDX 

ECX 

内 核 堆栈 指针 ESP EBX 
图 3.7 进入 中 断 理 程序 时 内 核 堆栈 示意 图 

EBX = 0800 
ECX= 4 
EDX= 0308 
ESI= 0x0C 
EDI= 0310 
EB = 0x14 
EAX= 0x18 
DS= Ox1C 
ES = 0x20 
ORIG EAX = 0x24 
EIP = 0x28 
CS = 0 


EFLAGS = 0x30 
OLDESP= 0x34 
OLDSS = 0x38 
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DOI [] [ | 
HH, ORIG FAX Æ Original eax 之 意 ， 其 具体 含义 将 在 后 面 介 绍 。 

2. 存放 在 栈 中 的 寄存 器 结构 pt_regs 

在 内 核 中 ， 很 多 函数 的 参数 是 pt regs 数据 结构 ， 定 义 在 include/i386/ptrace. h F: 


struct pt regs [ 
ng ebx; 
ng ecx; 
ng edx; 
በ፪ esi; 
በ፪ edi; 
በ፪ ebp; 
ng eax; 
xds; 




































































xes; 
ng orig eax; 
ng eip; 

xcs; 

ng eflags; 
ng esp; 

xss; 








5. “O. "OD, 7D oou VS Ss 00000: 05 ,סי‎ 000 





n 
把 这 个 结构 与 内 核 栈 的 内 容 相 比 较 ， 会 发 现 堆栈 的 内 容 是 这 个 数据 结构 的 一 个 映像 。 


3. 保存 现场 的 宏 SAVE ALL 


在 中 断 发 生前 夕 ， 要 把 所 有 相关 寄存 器 的 内 容 都 保存 在 堆栈 中 , 这 是 通过 SAVE ALL SE 




















成 的 : 
#define SAVE ALL \ 

ር10; ላ 

pushl %es; \ 
pushl %ds; \ 
pushl %eax; ላ 
pushl %ebp; \ 
pushl %edi; N 
pushl %esi; \ 
pushl %edx; \ 
pushl %ecx; ላ 
pushl %ebx; ላ 











movi $ ( KERNEL DS) , %edx; እ 
movi %edx, %ds; ላ 
movl %edx, %es; 


该 宏 执 行 以 后 ,堆栈 内 容 如 图 3. 7 所 示 。 把 这 个 宏 与 图 3. 6 结合 起 来 就 很 容易 理解 图 3.7, 
在 此 对 该 宏 再 给 予 解释 : 

e CPU 在 进入 中 断 处 理 程序 时 自动 将 用 户 栈 指针 【如果 更 换 堆栈 )、EFLAGS 寄存 器 及 返 
回 地 址 一 同 压 入 堆栈 。 

° 段 寄 存 器 DS 和 ES 原来 的 内 容 入 栈 ， 然 后 装 入 内 核 数 据 段 描述 符 KERNEL DS GE X. 
为 0x18)， 内 核 段 的 DPL 为 0。 
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4. 恢复 现场 的 宏 RESTORE ALL 














当 从 中 断 返 回 时 ， 恢 复 相关 寄存 器 的 内 容 ， 这 是 通过 RESTORE ALL 宏 完 成 的 : 
#define RESTORE ALL \ 
popl %ebx; d 
popl %ecx; \ 
popl %ed 
popl %es 
popl %ed 
popl %eb 
popl %ea 
1: popl Hd N 
2: popl %ፀ Ó 
8001 $4,%esp; ÓN 
3: iret; 


可 以 看 出 ，RESTORE_ALL 与 SAVE ALL 遥相呼应 。 当 执行 到 iret 指令 时 ， 内 核 栈 又 恢复 
到 刚 进入 中 断 门 时 的 状态 ， 并 使 CPU 从 中 断 返回 。 


5. 将 当前 进程 的 task struct 结构 的 地 址 放 在 寄存 器 中 


#define GET CURRENT (reg) ላ 
movl $-8192, reg; \ 
andl %esp, reg 


从 下 一 章 “task_struct 结构 在 内 存 存放 ”一 节 我 们 将 知道 ， 当 前 进程 的 task struct 
存放 在 内 核 栈 的 底部 ， 因 此 ， 以 上 两 条 指令 就 可 以 把 task_struct 结构 的 地 址 放 在 reg 寄存 
as o 


II 


2 ₪ mM < box tix x 



























































3.4.4 ”中断 处 理 程序 的 执行 


从 前 面 的 介绍 ， 我 们 已 经 知道 了 1386 的 中 断 机 制 及 有 关 的 初始 化 工作 。 现 在 ， 我 们 可 
以 从 中 断 请 求 的 发 生 到 CPU 的 响应 , 再 到 中 断 处 理 程 序 的 调用 和 返回 , 沿 着 这 一 思路 走 一 遍 ， 
以 体会 Linux 内 核对 中 断 的 响应 及 处 理 。 

假定 外 设 的 驱动 程序 都 已 完成 了 初始 化 工作 ， 并 且 已 把 相应 的 中 断 服务 例 程 挂 入 到 特定 
的 中 断 请 求 队列 。 又 假定 当前 进程 正在 用 户 空间 运行 (随时 可 以 接受 中 断 )， 且 外 设 已 产生 了 
一 次 中 断 请 求 。 当 这 个 中 断 请 求 通过 中 断 控制 器 82594 到 达 CPU 的 中 断 请 求 引 线 INTR 时 C 
看 图 3. 1)，CPU 就 在 执行 完 当 前 指令 后 来 响应 该 中 断 。 

CPU 从 中 断 控制 器 的 一 个 端口 取得 中 断 向 量 I， 然 后 根据 1 从 中 断 描述 符 表 IDT 中 找到 
相应 的 表 项 ， 也 就 是 找到 相应 的 中 断 门 。 因 为 这 是 外 部 中 断 ， 不 需要 进行 “ 门 级 ”检查 ，CPU 
就 可 以 从 这 个 中 断 门 获得 中 断 处 理 程 序 的 入 口 地 址 ， 假 定 为 IRQ0x05_interrupt。 因 为 这 里 
假定 中 断 发 生 时 CPU 运行 在 用 户 空间 (CPL 二 3), 而 中 断 处 理 程序 属于 内 核 (DPL 二 0)， 因 此 ， 
要 进行 堆栈 的 切换 。 也 就 是 说 ，CPU 从 TSS 中 取出 内 核 栈 指针 ， 并 切换 到 内 核 栈 (此 时 栈 还 
为 空 )。 当 CPU 进入 IRQ0x05 interrupt 时 , 内 核 栈 如 图 3.6 WO, 栈 中 除 用 户 栈 指针 、EFLAGS 
的 内 容 以 及 返回 地 址 外 再 无 其 他 内 容 。 另 外 ， 由 于 CPU 进入 的 是 中 断 门 (而 不 是 陷阱 门 )， 因 
此 ， 这 条 中 断 线 已 被 禁用 ， 直 到 重新 启用 。 


= 82 - 





























































































































































































































































































































































































































































































































我 们 用 IRQn interrupt 来 表示 从 IRQOxOl1 interrupt 到 IRQOxOf interrupt 任意 一 个 




































































它们 的 调用 关系 。 





IRQn interrupt 








handle IRQ event ( ( 





































1. 中 断 处 理 程序 IRQn interrupt 








P 断 服务 
例 程 1 
图 3.8 中 断 处 理 函 数 的 调用 关系 


断 处 理 程序 。 这 个 中 断 处 理 程序 实际 上 要 调用 do IRO, m do IRQO 要 调用 
handle IRQ event O 函数 ， 最 后 这 个 函数 才 真 正 地 执行 中 断 服 务 例 程 (ISR)。 图 3. 8 给 出 了 



























NEE 
።፳2 


我 们 首先 看 一 下 从 IRQOx01 interrupt 到 IRQOxOf interrupt 的 这 16 个 函数 是 如 何 定 











2 

SCE, 4 18259. c 中 定义 了 如 下 宏 : 
Hdefine BI (x,y) ላ 

BUILD IRQ Cx##y) 











#define BUILD 16 IRQS (x) ላ 
BI (x,0) BI (x,1) BI (x, 2) 
BI (x,4) BI 60 5( BI (x, 6) 
BI (x,8) BI (x,9) BI (x,a) 
BI (x,c) BI (x,d) BI (x,e) 


BUILD_16_IRQS (0x0) 

















BI (x,3) ላ 
BI (x, 7) 
BI (x,b) ላ 
BI (x, f) 


= 


经 过 gcc 的 预 处 理 ， 宏 定义 BUILD 16 IRQS (0x0) 会 被 展开 成 BUILD IRQ (0800) 至 








BUILD IRQ (0x0f). BUILD IRQ 宏 是 一 段 侍 入 式 汇编 代码 GE/include/i386/hw irg.h rB), 



































为 了 有 助 于 理解 ， 我 们 把 它 展开 成 下 面 的 汇编 语言 片段 





IRQn_interrupt: 
pushl $n-256 
jmp common interrupt 











把 中 断 号 减 256 的 结果 保存 在 栈 中 ， 这 就 是 进入 中 断 处 理 程 序 后 第 一 个 压 入 堆栈 的 值 ， 
也 就 是 堆栈 中 ORIG EAX 的 值 ， 如 图 3.7。 这 是 一 个 负数 ， 正 数 留 给 系统 调用 使 用 。 对 于 每 个 


























































































































中 断 处 理 程序 ， 唯 一 不 同 的 就 是 压 入 栈 中 的 这 个 数 。 然 后 ， 所 有 的 中 断 处 理 程序 都 跳 到 一 段 
相同 的 代码 comnon_interrupt。 这 段 代 码 可 以 在 BUILD COMMON IRQ 宏 中 找到 ， 同 样 ， 我 们 




















略 去 其 庶 入 式 汇编 源 代 码 ， 而 把 这 个 宏 展开 成 下 列 的 汇编 语言 片段 : 


common interrupt: 
SAVE ALL 
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call do IRQ 
jmp ret from intr 


SAVE ALL 宏 已 经 在 前 面 介绍 过 , 它 把 中 断 处 理 程序 会 使 用 的 所 有 CPU 寄存 器 都 保存 在 栈 
中 。 然 后 ，BUILD_COMMON_IRQ 宏 调用 do IRQ C ን 函数 ， 因 为 通过 CALL 调用 这 个 函数 ， 因 
此 ， 该 函数 的 返回 地 址 被 压 入 栈 。 当 执行 完 do IRQ 6 )， 就 跳 转 到 ret from intr ( ) 地 
址 (参见 后 面 的 “从 中 断 和 异常 返回 ”)。 


2. do IRQ €. ) 函数 


do IRQO 这 个 函数 处 理 所 有 外 设 的 中 断 请 求 。 当 这 个 函数 执行 时 ， 内 核 栈 从 栈 顶 到 栈 底 
包括 : 
e do IRQ C ) 的 返回 地 址 ; 
. SAVE ALL 推进 栈 中 的 一 组 寄存 器 的 值 ; 
e ORIG FAX (Bl 7-256); 
e CPU 自动 保存 的 寄存 器 。 
该 函数 的 实现 用 到 中 断 线 的 状态 ， 下 面 给 予 具体 说 明 : 
#define IRQ INPROGRESS 1 /# 正在 执行 这 个 IRQ 的 一 个 处 理 程序 #/ 
#define IRQ DISABLED 2. /* 由 设备 驱动 程序 己 经 禁用 了 这 条 IRQ 中 断 线 */ 
#define IRQ PENDING 4. /x 一 个 IRQ 己 经 出 现在 中 断 线 上 ， 且 被 应 答 ， 但 还 
没有 为 它 提供 服务 */ 

















































































































































































































































































































#define IRQ REPLAY 8 /ቾ 3 Linux 重新 发 送 一 个 已 被 删除 的 IRQ 时 */ 
#define IRQ AUTODETECT 16. /ቶ 当 进 行 硬件 设备 探测 时 ， 内 核 使 用 这 条 IRQ Pl 











Hi */ 
#define IRQ WAITING 32 / 00 AHA ARMA, Be RAS Did 


























正在 被 测试 的 irq x/ 
#define IRQ LEVEL 64 /* IRQ level triggered */ 
Hdefine IRQ MASKED 128 /* IRQ masked - shouldn’ t be seen again */ 


#define IRQ PER CPU 206 /* IRQ is per CPU */ 

这 9 个 状态 的 前 6 个 状态 比较 常用 ， 因 此 我 们 给 出 了 具体 解释 。 男 外 ， 我 们 还 看 到 每 个 
状态 的 常量 是 2 的 究 次 方 。 最 大 值 为 256 (2) ， 因 此 可 以 用 一 个 字 节 来 表示 这 9 个 状态 ， 
其 中 每 一 位 对 应 一 个 状态 。 

该 函数 在 arch / /1386/kernel/irq.c 中 定义 如 下 : 


asmlinkage unsigned int do IRQ (struct pt regs regs) 


{ 





























































































































/* RORE 0 则 意味 着 这 个 ira 正在 由 男 一 个 CPU 进行 处 理 ， 
或 这 条 中 断 线 被 禁用 */ 

int irq = regs. orig eax 6 Oxff; /* 还 原 中 断 号 x/ 

int cpu = smp processor 101.) ; / RAS CPU 号 #/ 


irq desc t *desc = irq desc + irq; / #fE irq_desc[] BZA ZE ira 的 描述 符 *# / 
struct irqaction * action; 
unsigned int status; 








kstat. irqs[cpu] [irq] ++; 
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spin lock (&desc->lock) ; /大 针对 多 处 理 机 加 锁 # / 
desc->handler->ack (irq) ;  / * CPU 对 中 断 请 求 给 予 确 认 * / 





























status = desc->status 6 ^ (IRQ REPLAY | IRQ WAITING) ; 
status |= IRQ PENDING; /* we want to handle it */ 





action = NULL; 

if (! (status & (IRQ DISABLED | IRQ INPROGRESS) ) ) í 
action = desc->action; 

tus 6= ^IRQ PENDING; /* we commit to handling */ 
tus |= IRQ INPROGRESS; /* we are handling it */ 


st 


° 





st 


° 


} 
desc-?status = status; 
if (laction) 

goto out; 
for uC eT 

spin unlock (&desc->lock) ;  / *HEA I bz 
handle 186 event (irq, 87088, action) ; 
spin lock (&desc->lock) ; / IG SED / 











if (! (desc->status & IRQ PENDING) כ‎ 
break; 
desc->status &= “IRQ PENDING; 
) 
desc->status &= “IRQ INPROGRESS; 
out: 
/ቾ 
* The ->end() handler has to deal with interrupts which got 
* disabled while the handler was running 
*/ 
desc->handler->end (irq) ; 
spin unlock (&desc->lock) ; 





if (softirq pending (cpu) ) 
do softirg(); / AES Ve / 
return 1; 








} 

下 面 对 这 个 函数 进行 进一步 的 讨论 。 

e 当 执行 到 for GO 这 个 无 限 循 环 时 ， 就 准备 对 中 断 请 求 队列 进行 处 理 ， 这 是 由 
handle IRQ event O 函数 完成 的 。 因 为 中 断 请 求 队列 为 一 临界 资源 ， 因 此 在 进入 这 个 函数 前 
要 加 锁 。 

e handle IRQ event (函数 的 主要 代码 片段 为 : 

if (! (action->flags & SA INTERRUPT) ) 

astig; /ቾ፳ቫ፳8ቻ/ 






































= 





do { 
status |= actionflags; 
action->handler (irq, action->dev id, regs) 
action = action->next; 
} while (action) ; 
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这 个 循环 依次 调用 请 求 队列 中 的 每 个 中 断 服 务 
述 ， 至 于 更 具体 的 解释 将 在 驱动 程序 
要 说 明 的 是 ， 中 断 服务 例 程 都 在 关 
也 是 为 什么 CPU EFT! 


进行 过 简单 




















Linux [ 




















) ; /# 开 中 断 #/ 





ር11 


























WIRE. Pl 












































这 上 








። 




















就 可 





ab רד‎ 
HEX 























进行 讨论 。 





经 验 表 明 , 应 该 避免 在 同一 条 中 断 线 - 








NER Du 
的 标志 位 肯 











GINA: (对 单 CPU 而 言 )， 所 以 循环 又 执行 
一 中 断 线 上 的 嵌 套 循环 化 解 为 “ 串 行 ”。 











IRQ_DISABLED 标志 位 ， 就 

















f 门 时 自动 关闭 中 断 的 原 
他 重要 的 中 断 。 也 就 是 说 ， 中 断 服 务 


事情 交 给 另外 一 部 分 来 处 理 。 即 后 半 部 分 (bottom 





章 进行 描述 。 
中 断 的 条 件 下 进行 
































因 。 但 是 ， 关 中 断 时 间 绝 不 


服务 例 程 及 其 参数 已 经 在 前 面 














(不 包括 非 屏蔽 中 断 )， 这 
ERK, EN 


























网 程 应 该 处 理 最 紧急 的 事情 ， 而 把 剩 下 的 














half) 来 处 理 ， 


SE 


这 一 部 分 内 容 将 在 下 一 











LAS ኮዝ ፳፳› 内核 通过 IRQ PENDING 标志 位 的 
E 了 这 一 点 。 当 do IRQO 执行 到 for (;;) 循环 时 ，desc->status 中 的 IRQ PENDING 
定 为 0( 想 想 为 什么 ?)。 当 CPU 执行 完 handle IRQ event O 函数 返回 时 ， 如 果 
这 个 标志 位 仍然 为 0， 那么 循环 就 此 结束 。 如 果 这 个 标志 位 变 为 1, I 

















不 同 的 CPU 不 允许 并 发 地 进入 同一 中 断 服务 例 程 ， 
程 必须 是 “可 重 入 ”的 纯 代码 。 可 习 
内 核 时 巧妙 地 “避难 就 易 ” 以 解决 问题 为 主要 目标 。 

i] FH desc-^handler-^endO pR ÅL, 











在 循环 结束 后 j 














调 
这 个 中 断 有 后 半 部 分 , 就 调 











FH 
ZM 

















如 











3.4.5 从 中 断 返 回 


从 前 面 的 讨论 我 们 知道 ，do_IRQ U 这 个 函数 处 理 
























































就 说 明 这 条 中 断 线 上 又 


次 。 通 过 这 种 循环 方式 ， 就 把 可 能 发 生 在 同 





AW, 那 就 要 求 所 有 的 中 断 服务 例 





入 代码 的 设计 和 实现 就 复杂 多 了 ， 


H 


AN 





了 低级 函数 enable 8259A ira O) XH 
] do 80፲11፲9() 执行 后 












































































































































Atk, Linux 在 设计 


体 来 说 ， 如 果 没 有 设置 























DÆ PT. 








EA. 


所 有 外 设 的 中 断 请 求 。 这 个 函数 执行 的 












































DIS, 内核 栈 栈 顶 包含 的 就 是 do IR 0 的 返回 地 址 ， 这 个 地 址 指向 ret from intr。 实 际 上 ， 
ret from intr 是 一 段 汇 编 语言 的 入 口 点 ， 为 了 描述 简 音 起见， 我们 以 函数 的 形式 提 及 它 。 
虽然 我 们 这 里 讨论 的 是 中 断 的 返回 ， 但 实际 上 中 断 、 异 常 及 系统 调用 的 返回 是 放 在 一 起 实现 
J， 因 此 ， 我 们 常常 以 函数 的 形式 提 到 下 面 这 3 个 入 口 点 。 
et from intr () 
终止 中 断 处 理 程序 。 
et from sys call ( ) 
终止 系统 调用 ， 即 由 0x80 引起 的 异常 。 
et from exception ( ) 
终止 除了 0x80 的 所 有 异常 。 
在 相关 的 计算 机 课程 中 ， 我 们 已 经 知道 从 中 断 返 回 时 CPU 要 做 的 事情 ， 下 面 我 们 来 看 一 
F Linux 内 核 的 具体 实现 代码 (在 entry. S HH): 
ENTRY (ret from intr) 
GET CURRENT (%ebx) 
ret from exception: 
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EFLAGS (%esp) , %eax 
movb CS (%esp) , %al 


# mix EFLAGS and CS 


16811 8 (VM MASK | 3) 
jne ret from sys call 
jmp restore all 





























, %e 


ax 














# re 


这 里 的 GET CURRENT (%ebx) 将 当前 进程 task struct 4 


此 时 ， 内 核 栈 的 内 容 还 如 图 
KP CS 寄存 


寄存 器 的 高 1 
"hr 


前 夕 CPU 是 

















6 位 与 








3.7 所 示 。 然 后 
器 的 内 容 拼 
否 够 运行 于 VM86 模式 ; 


中 断 前 儿 CPU 是 运行 在 用 户 空 间 还 是 内 核 空间 


X4 


VM86 模式 是 为 在 1386 保护 模式 下 模拟 i 
中 有 个 标志 位 表示 CPU 是 否 运行 在 VM86 模式 ， 我 们 在 此 不 予 详细 讨论 。CS 的 最 低 两 位 表示 


中 断 发 生 时 CPU 的 运行 级 别 CPL， 若 这 两 位 为 3， 说明 中 断 发 生 于 月 
如 果 中 断 发 生 在 内 核 空 





间 ， 











运行 DOS 


两 条 “ 


软 








DUE 





I 权 直 接 转移 





间或 VM86 模式 )， 则 转移 到 ret from sys call: 
ENTRY (ret from sys call) 


cli 


cmpl $0, need resched (%ebx) 


jne reschedule 


cmpl $0, sigpending (%ebx) 


jne signal return 


restore all: 


RESTORE_ALL 


reschedule: 
call SYMBOL NAME (schedule) 


























(%ebx) 表示 


jmp ret from sys call 


HEN ret from sys call 后 ， 
Brisk. A 








שר 








非 0， 说 明 需 





መት 











讨论 。 


同样 ， 如 果 当 
信号 等 待 处 理 ， 要 先 处 理 
讨论 。 处 理 完 





— HET 


经 介绍 过 


A Er Bi EA 


fi 


<= 





ዘ 




















首先 关中 




















后 ， 看 调度 标志 是 否 为 非 0， 其 中 党 


mov” 指 令 





结构 的 指针 放 入 寄存 器 EBX 中 ， 
是 为 了 把 中 断 发 生前 夕 EFALGS 


፳፪ 32 位 的 长 整数 ， 其 























到 restore all. 


turn to VM86 mode or non-supervisor? 


























的 是 要 检验 : 














HPB. 





# need resched and signals atomic test 


# 


test 


如 果 中 断 发 生 于 用 户 


a 





件 而 设置 的 ，EFALGS 寄存 器 高 16 位 


断 ， 也 就 是 说 ， 执 行 这 段 代 码 时 CPU 不 接受 任何 




















前 进程 的 task struct 结构 中 的 si 
完 这 些 信 号 后 才 从 中 断 返 回 ， 











信号 ， 控 4 





SUE ze [= 
， 也 就 是 恢复 中 断 现 场 ， 彻 底 从 中 断 返 





常量 








E 





前 进程 task struct 结构 中 偏 移 量 need resch 
HE, WEH schedule 0 函数 进行 进程 


关于 信和 号 的 处 理 
到 restore all. RESTORE ALL 宏 操作 在 前 





调度 ， 这 将 在 第 五 草 进行 详细 


need resched 定义 为 20，need resched 
ed 处 的 内 容 ， 





如 果 调 度 标 


ליק 





























gpending 标志 为 非 0， 则 表示 该 进程 有 














ege 


E“ 进 程 间 通信 ” 

















3.5 中 断 的 后 半 部 分 处 理 机 制 















































ዘዘ 





IE, Linux 并 不 是 一 口气 把 中 断 所 
部 分 来 做 ， 本 节 我 们 将 具体 描述 内 核 怎样 处 理 


半 部 











את 








prn 


bei 





全 部 做 完 ， 而 是 


N 


= 


NA 
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Linux [ 


ooi 
3.5.1 为 什么 把 中 断 分 为 两 部 分 来 处 理 


中 断 服务 例 程 一 般 都 是 在 中 断 请 求 关闭 的 条 件 下 执行 的 , 以 避免 散 套 而 使 中 断 控制 复杂 
化 。 但 是 ， 中 断 是 一 个 随机 事件 ， 它 随时 会 到 来 ， 如 果 关 中 断 的 时 间 太 长 ，CPU 就 不 能 及 时 
响应 其 他 的 中 断 请 求 ， 从 而 造成 中 断 的 丢失 。 因 此 ， 内 核 的 目标 就 是 尽 可 能 快 地 处 理 完 中 断 
请 求 ， 尽 其 所 能 把 更 多 的 处 理 向 后 推迟 。 例 如 ， 假 设 一 个 数据 块 已 经 达到 了 网 线 ， 当 中 断 控 
制 器 接受 到 这 个 中 断 请 求 信号 时 ，Linux 内 核 只 是 简单 地 标志 数据 到 来 了 ， 然 后 让 处 理 器 恢 
复 到 它 以 前 运行 的 状态 ， 其 余 的 处 理 稍 后 再 进行 (如 把 数据 移入 一 个 缓冲 区 ， 接 受 数据 的 进 
程 就 可 以 在 缓冲 区 找到 数据 ) 。 因 此 ， 内 核 把 中 断 处 理 分 为 两 部 分 : 前 半 部 分 (top half) 
和 后 半 部 分 (bottom half)， 前 半 部 分 内 核 立 即 执行 ， 而 后 半 部 分 留 着 稍 后 处 理 ， 如 图 3.9 
所 示 。 
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bottom half 


MER 





响应 中 断 请 求 、 读 
职 或 者 发 送 相 关 的 
数据 


图 3.9 中 断 的 分 割 




















首先 ， 一 个 快速 的 “前 半 部 分 ”来 处 理 便 件 发 出 的 请 求 ， 它 必须 在 一 个 新 的 中 断 产 生 之 
前 终止 。 通 常情 况 下 ， 除 了 在 设备 和 一 些 内 存 缓冲 区 如 果 设 备用 到 了 DMA， 就 不 止 这些 ) 
之 间 移 动 或 传送 数据 ， 确 定 人 硬件 是 否 处 于 健全 的 状态 之 外 ， 这 一 部 分 做 的 工作 很 少 。 
然后 ， 就 让 一 些 与 中 断 处 理 相 关 的 有 限 个 函数 作为 “后 半 部 分 ”来 运行 : 
。 人 允许 一 个 普通 的 内 核 函 数 , 而 不 仅仅 是 服务 于 中 断 的 一 个 函数 , 能 以 后 半 部 分 的 喘 份 
来 运行 
















































































允许 几 个 内 核 函 数 合 在 一 起 作为 一 个 后 半 部 分 来 运行 。 
后 半 部 分 运行 时 是 允许 中 断 请 求 的 ， 而 前 半 部 分 运行 时 是 关中 断 的 ， 这 是 二 者 之 间 的 主 


























3.5.2 实现 机 制 


Linux 内 核 为 将 中 断 服 务 分 为 两 部 分 提供 了 方便 ， 并 设立 了 相应 的 机 制 。 在 以 前 的 内 核 
中 ， 这 个 机 制 就 叫 bottom half (简称 bh) ， 但 在 2.4 版 中 有 了 新 的 发 展 和 推广 ， 叫 做 软 中 
Wr 6501+170( 
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1. ከከ 机 制 





以 前 内 核 中 的 bh 机 制 设 置 了 
起 来 ， 其 大 小 为 32， 数 组 中 的 每 
两 个 32 位 无 符号 整数 bh active 和 bh mask， 每 个 无 符号 整数 
的 一 个 元 素 ， 如 图 3. 10 AA. 

在 2.4 以 前 的 内 核 中 , 每 次 执行 完 do_IRQ()! 
一 个 叫 do bottom half 0 的 函数 ! 
在 do bottom half() 中 对 bh 函数 的 执行 是 在 
这 种 方式 简化 了 bh 

















结束 之 前 ， 就 在 











执行 进行 了 严格 的 “ 串 行 化 ”， 















































一 个 函数 指针 数组 bh base[], 它 把 所 有 的 后 半 











数 的 执行 可 以 不 嵌 套 ， 而 对 于 多 CPU 来 说 ， 在 





bh mask 是 否 安装 


3130 2 10 


Bh_active 是 否 激活 


3130 


这 种 简化 了 的 设计 在 一 定 程度 上 保证 了 从 单 CPU 到 多 CPU SMP 结构 的 平稳 过 渡 ， 但 随 着 
TT SMP 的 性 能 有 不 利 的 影响 。 因 六 
bh 函数 需要 执行 时 ，bh 函数 的 “ 串 行 化 ” 却 只 能 使 一 个 CPU 执行 一 个 bh 函数 ， 
使 空间， 也 不 能 执行 其 他 的 bh ፳፪. 


时 间 的 推移 ， 就 会 发 现 这 样 的 处 天 

















2 






































void(*bh_basel[32])(void) 


0 TIMER_BH 
1 CONCOLE_BH 


TQUEUE_BH 
DIGI_BH 





3.10 bh 机 制 示 



































的 设计 ， 这 是 因 
































根本 发 挥 不 出 多 CPU 的 优势 。 


那么 ， 在 新 内 核 的 设计 中 ， 
选择 了 一 种 折衷 的 办 法 ,继续 保留 bh VLA, 另外 增加 一 种 
一 的 框架 中 ， 这 就 是 2.4 内 核 中 的 软 














2.， 软 中 断 机 制 














软 中 断 机 制 也 是 推迟 内 核 函 数 的 执行 ， 然 而 ， 














是 改进 bh BL 




















却 在 任何 时 候 都 不 需要 串 行 化 ,同一 个 软 ! 
当然 ， 在 这 种 情况 下 ， 软 中 断 必 有/ 























为 2.4 内 核 中 用 两 个 软 中 断代 符 原来 的 一 个 NET BH 函数 , 这 就 使 得 在 多 处 理 














的 执行 更 为 高 效 。 























此 可 以 看 出 ，bh 函数 的 日 





建立 一 种 
或 几 种 机 4 Til , 
Wr Csoftirg) 机 制 。 


I 还 是 抛弃 bh HL 








与 bh 函数 严格 地 串 行 执行 相 比 ， 软 




















断 的 两 个 实例 完全 有 可 能 在 两 个 CPU 
是 可 重 入 的 。 软 中 断 给 网 络 部 分 带 来 的 好 处 尤为 突出 ， 


























的 一 位 对 应 着 bh_base[]! 





的 中 断 服 务 例 程 以 后 ， 以 及 每 次 系统 调用 
执行 相应 的 bh 函数 。 

也 就 是 说 对 bh‏ רק 
为 ， 对 单 CPU 来 说 ,bh Bk‏ 
同一 时 间 内 最 多 只 允许 一 个 CPU 执行 bh ፳፪.‏ 


void timer_bh[void] 


void tqueue_bh[void] 



































MAS ES] 





上 同时 运行 。 





部 分 都 组 织 
项 就 是 一 个 后 半 部 分 ， 即 一 个 bh 函数 。 同 时 ， 又 设置 了 























的 





当 系 统 中 有 很 多 个 
其 他 CPU 即 
行 化 是 针对 所 有 CPU 的 ， 


新 的 机 制 ?2. 4 
并 把 它们 纳入 一 个 统 


Wr 





D 
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3. Tasklet ቹ1ቨ] 








另 一 个 类 似 于 bh 的 机 制 叫做 tasklet. Tasklet 建立 在 软 中 断 之 上 ， 但 与 软 中 断 的 区 别 
是 ， 同 一 个 tasklet 只 能 运行 在 一 个 CPU 上 ， 而 不 同 的 tasklet 可 以 同时 运行 在 不 同 的 CPU 
上 。 在 这 种 情况 下 ，tasklet 就 不 需要 是 可 重 入 的 ， 因 此 ， 编 写 tasklet EAE AFAR 
要 容易 。 

Bh 机 制 在 2. 4 中 依然 存在 , 但 不 是 作为 一 个 单独 的 机 制 存在 , 而 是 建立 在 tasklet 之 上 。 
因此 ， 在 2.4 版 中 ， 设 备 驱动 程序 的 开发 者 必须 更 新 他 们 原来 的 驱动 程序 ， 用 tasklet 代替 
ከከ, 
















































































3.5.3 数据 结构 的 定义 


在 具体 介绍 软 中 断 处 理 机 制 之 前 ， 我 们 先 介绍 一 下 相关 的 数据 结构 ， 这 些 数据 结构 大 部 
分 都 在 / include/linux/interrupt.h 中 。 


1， 与 软 中 断 相 关 的 数据 结构 


软 中 断 本 身 是 一 种 机 制 ， 同 时 也 是 一 种 基本 框架 。 在 这 个 框架 中 ， 既 包含 了 bh BLE 
也 包含 了 tasklet 机 制 。 
CD 内 核定 义 的 软 中 断 


enum 

































































= 
` 











{ 
HI SOFTIRQ=0, 
NET TX SOFTIRQ, 
NET RX SOFTIRQ, 
TASKLET 68 
P 
内 核 中 用 枚 举 类 型 定义 了 4 种 类 型 的 软 中 断 ， 其 中 NET ፲፪ SOFTIRQ 和 NET RX SOFTIRQ 
两 个 软 中 断 是 专 为 网 络 操作 而 设计 的 ， 而 HI SOFTIRQ 和 TASKLET SOFTIRQ 是 针对 bh 和 
tasklet 而 设计 的 软 中 断 。 编 码 作 者 在 源码 注释 中 曾 提 人 到， 一 般 情况 下 ， 不 要 再 分 配 新 的 软 
] Wr. 
(2) 软 中 断 向 量 


truct softirq action 

















































































































n 


{ 
void Ckaction) (struct softirq action *) ; 
void *data; 


) 





static struct softirq action softirq vec[32]  cacheline aligned: 
从 定义 可 以 看 出 ， 内 核定 义 了 32 个 软 中 断 向 量 ， 每 个 向 量 指向 一 个 函数 ， 但 实际 上 ， 
内 核 目 前 只 定义 了 上 面 的 4 个 软 中 断 ， 而 我 们 后 面 主要 用 到 的 为 HI SOFTIRQ 和 
TASKLET SOFTIRQ 两 个 软 中 断 。 
(3) 软 中 断 控 制 / 状态 结构 
softirq vec [] 是 个 全 局 量 ， 系 统 中 每 个 CPU 所 看 到 的 是 同一 个 数组 。 但 是 ， 每 个 CPU 
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KAI 


























irq stat 
typedef struct ( 


*/ 





2 Gg ፎ ፎ E 
= 
n 
og 
= 
ጩ 
e 





unsigned 


[ | ርፀርከፀ11ከፀ a 





irq cpustat t irq 



































的 “ 软 中 断 控制 / 状态 ”结构 ， 这 些 数据 结构 形成 一 个 以 CPU 编号 为 下 标的 数组 
[] GE MÆ include/i386/hardirg.h rH) 








int  softirq pending; 
int _ local 120 count; 
int _ local bh count; 
int _ syscall count; 





truct task struct *  ksoftirqd task; /* waitqueue is too large */ 


int nmi count; /* arch dependent */ 
ligned irq cpustat t; 








stat [NR CPUS]; 





irq stat JAB NERE, BEAN CPU 可 以 按 其 自身 的 编号 访问 相应 的 域 。 于 






































内 核定 义 了 如 下 宏 (在 include/linux/irq cpustat.h 中 ) : 
#ifdef CONFIG SMP 
ne  IRQ STAT (cpu, member) ( 1፲ቧ stat[cpu]. member) 


#defi 
#else 
#defi 
#endi 


/ቾ ar 
#defi 
#defi 
#defi 
#defi 
#defi 
/ቾ 
#defi 











ne  IRQ STAT (cpu, member) ( (void) (cpu), irq stat[0]. member) 

f 

ch independent irq stat fields */ 

ne softirq pending (cpu) - IRQ STAT ( (cpu), softirq pending) 

ne local irq count (cpu) . IRQ STAT ( (cpu), local irq count) 

ne local bh count (cpu) . IRQ STAT € (cpu), _ local bh count) 

ne syscall count (cpu) . IRQ STAT € (cpu) , _ syscall count) 

ne ksoftirqd task (cpu) . IRQ STAT ( (cpu), — ksoftirqd task) 

arch dependent irq stat fields */ 

ne nmi count (cpu) . IRQ STAT ( (cpu), nmi count) /* 1386, ia64 





2. 与 tasklet 相关 的 数据 结构 


与 bh 函数 相 比 ，tasklet 是 “多 序 ” 的 bh 函数 。 内 核 中 用 tasklet task 来 定义 一 个 
tasklet: 
struct tasklet_struct 


{ 


); 





struct tasklet struct *next; 


unsigned 
atomic t 


ong state; 
count; 


void (*func) (unsigned long) ; 


unsigned 





ong data; 




















从 定义 可 以 看 出 ，tasklet_struct 是 一 个 链表 结构 ， 结 构 中 的 函数 指针 func 指向 其 服 





务 程序 .内 核 











还 定义 了 一 个 以 CPU 编号 为 下 标的 数组 tasklet vec [ |ቭ] tasklet ות‎ 


struct tasklet head 


[ 


} attribute 


struct t 


asklet_struct *list; 
) C aligned (SMP CACHE BYTES) ) כ‎ 
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extern struct tasklet head tasklet vec[NR CPUS]; 
extern struct tasklet head tasklet hi vec[NR CPUS]; 








O OI Linux [ 












































这 两 个 数组 都 是 tasklet head 结构 数组 ， 个 tasklet head 结构 就 是 一 个 
tasklet struct 结构 的 队列 头 。 


3. 与 ከከ 相关 的 数据 结构 
前 面 我 们 提 到 ，bh 建立 在 tasklet 之 上 ， 更 具体 地 说 ， 对 一 个 bh 的 描述 也 是 























tasklet struct 结构 ， 只 不 过 执行 机 制 有 所 不 同 。 
tasklet， 而 任何 时 刻 ， 即 使 在 多 个 CPU b, «Hf 





(1) bh 的 类 型 
enum { 

TIMER BH = 0 
TQUEUE_BH, 
DIGI BH, 
SERIAL BH, 
RISCOM8 BH, 
SPECIALIX BH, 
AURORA BH, 
ESP BH, 
SCSI BH, 
IMMEDIATE BH, 
CYCLADES BH, 
CM206 BH, 
JS BH, 
MACSERIAL BH, 
ISICOM BH 





je 












































因为 在 不 同 的 CPU 上 可 以 同时 执行 不 同 的 
有 一 个 bh 函数 执行 。 











se 


/* 定时 器 */ 

/* 周期 性 任务 队列 */ 
/* DigiBoard PC/Xe ቾ/ 
/* 串 行 接口 */ 


/ 


SØ Fag 


/ 
/ 




















/* RISCom/8 */ 
Specialix 108+ */ 
/* Aurora ZW IE (SPARC) ቾ/ 
/* Hayes ESP ቹቭጐ */ 
SCSI 接口 */ 
立即 任务 队列 */ 
Cyclades Cyclom-Y 串 行 多 端口 ቾ/ 
CD-ROM Philips/LMS cm206 磁盘 */ 
/* 游戏 杆 (PC IBM) */ 
Power Macintosh 的 串 行 端口 */ 
MultiTech በዛ ISI ኑ*/ 




































































在 给 出 bh 定义 的 同时 ， 我 们 也 给 出 了 解释 。 从 定义 中 可 以 看 出 ， 有 些 bh 与 硬件 设备 相 





(2) bh 的 组 织 结构 








关 ， 但 这 些 硬 件 设备 未 必 装 























在 系统 中 ， 或 者 仅仅 是 针对 IBM PC 兼容 机 之 外 的 某 些 平台 。 








在 2. 4 以 前 的 版 本 中 ,把 所 有 的 bh 用 一 个 bh_base[] 数 组 组 织 在 一 起 ,数组 的 每 个 元 素 





指向 一 个 bh 函数 : 





static void (ቐከከ base[32]) (void) ` 

2.4 版 中 保留 了 上 面 这 种 定义 形式 ， 但 又 定义 了 另外 一 种 形式 : 

struct tasklet struct bh task vec[32]; 

这 也 是 一 个 有 32 个 元 素 的 数组 ， 但 数组 的 每 个 元 素 是 一 个 tasklet struct 结构 ， 数 组 
的 下 标 就 是 上 面 定 义 的 枚 举 类 型 中 的 序号 。 



































3.5.4 Bir. bh 及 tasklet 的 初始 化 


1. Tasklet 的 初始 化 











Tasklet 的 初始 化 是 











void tasklet_init (st 
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t 


asklet init (函数 完成 的 : 


uct tasklet struct *t, 












































void (func) (unsigned long) , unsigned long data) 


t->next = NULL; 

t->state = 0; 

atomic set (&t->count, 0) ; 
t->func = func; 

t->data = data; 


He, atomic set O 为 原子 操作 , EX t—>count HW 0. 








2. H 








断 的 初始 化 














首先 通过 open softirqO 函数 打开 软 中 断 : 





void 


{ 


} 


open softirq (int nr, void (action) 





softirq vec[nr]. data = data; 
softirq vec[nr]. action = action; 














然后 ， 通 过 softirq init O 函数 对 软 中 断 进 行 初始 化 ; 


void init softirq init 





{ 


} 


XIF bh HJ 32 ት tasklet struct, 调用 tasklet init 以 后 
指向 bh action O 函数 ， 也 就 是 建立 了 bh 的 执行 机 机 





int i; 


for (i=0; i<32; i++) 
tasklet init (bh task vecti, ከከ action, i) 


open softirq (TASKLET SOFTIRQ, tasklet action, NULL 
open softirq (HI SOFTIRQ, tasklet hi action, NULL) ; 


ኤ“ 


























ጨጨ 




















就 像 具 体 的 ， 





























， 它 们 的 函数 指针 func 全 
， 但 具体 的 bh 函数 还 没有 与 之 挂 勾 ， 
断 服 务 例 程 还 没有 挂 入 中 断 服 务 队 列 一 样 。 同 样 ， 调 用 open softirqO WH, 


(struct softirq action*) , void *data) 





>] 
H 





É 


፳ ባጀ TASKLET SOFTIRQ 的 服务 例 程 为 tasklet action), mP K HI SOFTIRQ 的 服务 例 
程 为 tasklet hi action). 





3. Bh 的 初始 化 
bh 的 初始 化 是 由 init bh 0 完成 的 : 


void init bh (int nr, void (#routine) (void) ) 


{ 


} 














这 里 调用 的 函数 mb O 与 CPU 4 





bh base[nr] = routine; 
mb () ; 








面 看 一 下 几 个 有 具体 bh 的 初始 化 (在 kernel/sched. c 中 ) : 
init_bh (TIMER BH, timer bh) ; 
init bh (TUEUE BH, tqueue bh) ; 
init bh (IMMEDIATE BH, immediate bh) ; 
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执行 指令 的 流水 线 有 关 ， 我 们 对 此 不 进行 进一步 讨论 。 下 


























[ Linux [] [| ה‎ [1 Í 




































































处 理 周 























列 中 排队 等 待 。 


3.5.5 后 半 部 分 的 执行 


1. Bh 的 处 理 








大 约 每 隔 10 








初始 化 以 后 ，bh_base [TIMER_BH] 处 理 定时 器 队列 timer bh, BENIN ep 


TIMER BH, 在 第 五 章 将 会 看 到 , 这 意味 着 











WT ES 





s 这 个 队列 运行 一 次 bnh_base[LTUEUE_BH] 
期 性 的 任务 队列 tqueue bh, 而 bh base[IMMEDIATE BHj] 通 常 被 驱动 程序 所 调用 , 请 求 
某 个 设备 服务 的 内 核 函数 可 以 链接 到 IMMEDIATE BH 所 管理 的 队列 immediate ኮከ 中 ， 在 该 队 








当 需 要 执行 一 个 特定 的 bh 函数 〈 例 如 bh base [TIMER BH] OO 时 ， 首 先 要 提出 请 求 ， 这 

















₪ 


static inline void mark bh 


{ 





tasklet hi schedu 
} 


mark ከከ (函数 完成 的 (在 Interrupt. ከ 4) : 


(int nr) 


e (bh task vectnr) ; 





从 上 面 的 介绍 我 们 已 经 知道 ，bh_task_vec[] 每 个 元 素 为 tasklet struct SR, KZI 


指针 func 指向 bh action). 


接 下 来 ， 我 们 来 看 tasklet hi schedule O 完成 什么 功能 ， 


static inline void tasklet hi schedule (struct tasklet struct %%( 


{ 
if (! 
int cpu = smp p 
unsigned long 


local irq save ( 
t->next = 
tasklet hi 
cpu raise soft 
local irq: 


task 
_vecl 











esto 














flags; 


其 中 smp processor 14() IR 


flags) 

et hi vec[cpu]. list; 
cpu].list = t; 

irq (cpu, HI SOFTIRQ) ; 
e (flags) 


test and set bit (TASKLET STATE SCHED, &t->state) ) 
rocessor_id(); 


加 当前 进程 所 在 的 CPU 号 ， 








然后 以 此 为 下 标 从 





tasklet hi vec [ ] 中 找到 该 CPU HIMFR, 把 参数 t 所 指向 的 tasklet struct 结构 链 入 这 














NBA | 
数 “ 调 度 ” 到 哪个 








CPU 




















就 不 允许 再 将 其 




















软 中 断 对 应 。 


此 可 见 ， 当 某 个 bh 函数 被 请 
上 执行 。 另 一 方面 ，tasklet struct 
行 ， 在 同一 时 间 内 ， 只 能 把 它 链 入 一 个 队列 中 ， 而 不 可 能 后 
tasklet struct 结构 ， 如果 已 经 对 其 调用 了 tasklet hi schedule O A, 而 尚未 得 到 执行 ， 
链 入 该 队列 ， 所 以 标志 位 TASKLET_STATE_SCHED 就 
通过 cpu_raise_softirq0 〇 发 出 软 中 断 请 求 ， 其 中 的 参数 HI_SOFTIRQ 表示 bh 与 HI_SOFTIRQ 

















软 中 断 HI SOFTIRQ 的 服务 例 程 为 tasklet hi actionO: 


static void tasklet hi action (struct softirq action *a) 


{ 
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求 执 行 时 ， 当 前 进程 在 哪个 CPU 上 ， 就 把 这 个 bh ኤ 
代表 着 将 
时 出 现在 多 个 队列 中 。 对 同一 个 





要 对 bh 函数 的 一 次 执 





是 保证 这 一 点 的 。 最 后 ， 





























int cpu = smp processor 10.) ; 
struct tasklet struct *list; 


local irq disable): 
list = tasklet hi vec[cpu]. list: 
tasklet hi vec[cpu]. list = NULL; /*8ቻች/1ቹ፤*/ 


local irq enable): 





while (list) [ 
struct tasklet struct St = list; 


list = list->next; 


if (tasklet trylock (1) ) Í 
if (latomic read (&t->count) ) { 
if (!test and clear bit (TASKLET STATE SCHED, &t->state) ) 

BUG () ; 

t->func (t->data) ; 

tasklet unlock (1) ; 

continue; 
} 
tasklet unlock (1) ; 





} 


local irq disable(); 
t->next = tasklet hi vec[cpu]. list; 
tasklet hi vec[cpu]. list = t; 
_ cpu raise softirq (cpu, HI SOFTIRQ) ; 
local irq enable): 


] 

这 个 函数 除了 加 锁 机 制 以 外 ， 读 起 来 比较 容易 。 其 中 要 说 明 的 是 t->func (t->data) if 
句 ， 这 条 语句 实际 上 就 是 调用 bh action O 函数 : 

/* BHs are serialized by spinlock global ከከ lock 























It is still possible to make synchronize bh() as 

spin unlock wait (&global bh lock) . This operation is not used 
by kernel now, so that this lock is not made private only 

due to wait on irq(). 


It can be removed only after auditing all the BHs 
*/ 
spinlock t global bh lock = SPIN LOCK UNLOCKED; 


static void bh action Cunsigned long nr) 
{ 


int cpu = smp processor id(); 


if (!spin_trylock (&global bh lock) ) 
goto resched; 


if Clhardirq trylock (cpu) ) 
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goto resched unlock; 


if (ከከ base[nr]) 
bh base[nr] O ; 


hardirq endlock (cpu) ; 
spin unlock 68810081 bh lock) ; 
return; 


resched unlock: 
spin unlock 68810081 bh lock) ; 
resched: 





mark bh (nr) ; 
} 


这 里 对 bh 函数 的 执行 又 设置 了 两 道 锁 。 一 是 hardirq_trylock() ， 这 是 防止 从 一 个 硬 中 
断 内 部 调用 bh action) 。 另 一 道 锁 是 spin trylock O 。 这 把 锁 就 是 全 局 量 global bh lock, 
只 要 有 一 个 CPU 在 这 个 锁 所 锁 住 的 临界 区 运行 ， 别 的 CPU 就 不 能 进入 这 个 区 间 ， 所 以 在 任何 
时 候 最 多 只 有 一 个 CPU 在 执行 bh 函数 。 至 于 根据 bh 函数 的 编号 执行 相应 的 函数 ， 那 就 比较 
容易 理解 了 。 


2， 软 中 断 的 执行 


内 核 每 当 在 do_IRQ U 中 执行 完 一 个 中 断 请 求 队列 中 的 中 断 服务 例 程 以 后 
有 软 中 断 请 求 在 等 待 执行 。 下 面 是 do IRQO 中 的 一 条 语句 : 

if (softirq pending (cpu) ) 
do softirg(); 


在 检测 到 软 中 断 请 求 以 后 ， 就 要 通过 do softiraO 执行 软 中 断 服 务 例 程 ， 其 代码 在 / 
kernel/softirg. c #: 
asmlinkage void do softirq() 
























































































































































都 要 检 


Ki 
፳፪ 
D 
















































































{ 
int cpu = smp processor 10.) ; 
__u32 pending; 
long flags; 
. u32 mask; 
if (in interrupt O) 
return; 
local irq save (flags) ;/*}E eflags 寄存 器 的 内 容 保存 在 flags 变量 中 类 / 
pending = softirq pending (cpu) ; 
if (pending) { 
struct softirq action *h; 
mask = "pending; 
local bh በ188ከ16() ; 
restart: 


/* Reset the pending bitmask before enabling irqs */ 
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11 





TJ 





的 执行 进行 “ 串 


AT 


让 它们 相互 了 


local 170 restore (flags) 


) 
































softirq pending (cpu) = 0; 


local 126 enable);  /#* 开 中 断 #/ 





ከ = softirq vec; 


do { 
if (pending & 1) 
h->action (ከ) ; 
ከተተ; 
pending <<= 1; 
} while (pending) ; 


local irq disable); / #ኗቸ፳፡#/ 


pending = softirq pending (cpu) ; 
if (pending & mask) { 
mask 6= ”pending; 
goto restart; 
} 
- local bh enable): 


if (pending) 
wakeup softirqd (cpu) ; 





/ 大 恢复 eflags 寄存 器 的 内 容 * / 





从 do softirq O 的 代码 可 以 看 出 , 使 CPU 不 能 执行 软 中 断 服 务 例 程 的 “关卡 ”只 有 一 个 ， 


Ab in interrupt), 这 个 宏 限 制 了 软 ! 


ቆሩ 






























































AR AS Bi EB AN BEA: ተወ S ARS PEE UN‏ וו 
8ተቼሰ TT TIR ØRE UM EDT CAN TREE‏ » 
行 化 ”限制 。 这 也 就 是 说 ， 不 同 的 CPU‏ 


。 但 这 个 函数 并 没有 对 中 断 服务 例 程 
可 以 同时 进入 对 软 中 断 服 务 例 程 的 执 














， 每 个 CPU 分 别 执行 各 自 所 请 求 的 软 中 断 服 务 。 从 这 个 意义 上 说 ， 软 中 断 服务 例 程 的 执行 
是 “并 发 的 ”、 











MAP BG KG INE 
前 只 定义 了 4 个 软 中 断 ,在 对 软 ! 











tasklet hi action()。 因 
前 面 已 经 给 出 了 tasklet | 








机 





在 此 不 再 给 出 。 





















































“多 序 的 ”。 但 是 ， 这 些 软 中 断 服 务 例 程 的 设计 和 实现 必须 十 分 小 心 ， 不 能 
F 扰 《例如 通过 共享 的 全 局 变量 ) 。 









































3.5.6 把 bh 移 植 到 tasklet 




















可 以 知道 ， 尽 管内 核 最 多 可 以 处 理 32 个 软 中 断 ， 但 目 
断 进行 初始 化 时 ，soft_Init O 函数 只 初始 化 了 两 个 软 中 断 
TASKLET SOFTIRQ 和 HI_SOFTIRQ， 这 两 个 软 中 断 对 应 的 服务 例 程 为 tasklet_action() 和 
此 ，do_softirq() 中 的 do while 循环 实际 上 是 调用 这 两 个 函数 。 
hi action (0 的 源 代 码 , 而 tasklet_action (0 的 代码 与 其 基本 一 样 ， 


















































4: Linux 2.2 中 ， 对 中 断 的 后 半 部 分 处 理 只 提供 了 bn 机 制 ， 而 在 2.4 中 新 增加 了 两 种 





il: 软 中 断 和 tasklet。 通 过 | 



































上 面 的 介绍 我 们 知道 ， 同 一 个 软 中 断 服 务 例 程 可 以 同时 在 不 
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IJ] CPU 上 运行 。 为 了 提高 SMP 的 性 能 ， 软 中 断 现 在 主要 用 在 网 络 子 系统 中 。 多 个 tasklet 
可 以 在 多 个 不 同 的 CPU 上 运行 ， 但 一 个 CPU 一 次 只 能 处 理 一 个 tasklet. bh 由 内 核 进行 了 串 
行 化 处 理 ， 也 就 是 在 SPM 环境 中 ， 某 一 时 刻 ， 一 个 bh 函数 只 能 由 一 个 CPU 来 执行 。 如 果 要 把 
Linux 2.2 中 的 ph 移植 到 2.4 的 tasklet， 请 按 下 面 方 法 进行 。 





LU OI Linux [ 





























































































































1. Linux 2.4 中 对 bh 的 处 理 

















假设 一 个 bh Jy FOO BH (F00 表示 任意 一 个 ) ， 其 处 理 函 数 为 foo bh, Ml: 
(1) 处 理 函 数 的 原型 为 : void foo bh (void) 1 

(2) 通过 init bh (FOO BH, foo bh) 函数 对 foo bh 进行 初始 化 ; 

(3) ad mark bh (F00 BED 函数 提出 对 foo bh 0 的 执行 请 求 。 




















2. 把 bh 移植 到 tasklet 




















(1) 处 理 函 数 的 原型 为 : void foo bh (unsigned long data) ; 
(2) 通过 宏 DECLARE TASKLET DISABLED (foo tasklet, foo bh, 0) ፲፪ 


struct tasklet struct foo tasklet; 
tasklet init 66100 tasklet, foo bh, 0) ; 
tasklet disable (&foo tasklet) ; 


对 foo tasklet 进行 初始 化 
(3) 通过 
tasklet enable 68100 tasklet) : 
tasklet schedule 68100 tasklet) : 
对 foo tasklet 进行 调度 。 
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U U U U D U D 0 0 0 D 0 0 0 0 0 DU U D U 0 U D U 0 0 0 000 U DU 0 0 U UD 
םםםםםםם‎ Hn 00000 0000000000 Bag 000000 U 
task strut D D D 0 0 0 00 D D D D 0 D 0000 D DDD 00 4000000000 
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41 |] [] [] [] ה‎ [] Process and Prograni] 
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00000000 SystemSegentJ000000000000 
[በ0000000000000000000000000000000000000 
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OO“ i+ for(i=0; i 40 iH;0”O0000000000000000000000 
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O000000000000000000000000000000000000000 
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EXE 
(存放 被 执行 的 机 器 指令 ) 
፪ 
用 户 数据 段 E 
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| Linux [ L I 
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O0O0000000000000000000000000000000000000 
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በ D D ፲[ በ” D በ በ “O Process Swt chi ng] 07 DD D D "D" D D በ በ በ @ntext 
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GO DD DD 0000 U‏ נבםםםםםםםםםםםםםםםםםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U‏ 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
6nsQQ000000000000000000000000000‏ בםםםםםםם 
U U U UU U D 0 U‏ 

GUD DD 0000 DD D D 0 0 n DDD DD 0 00 መ‏ םםםםםםםםםם 
pins] SM OQO0000006nsQ000000000000000 OOO‏ 
ROO‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם 
O000000000000000000000000‏ וש םםםםםםםםםםםם 
U U U U U U D 0 0 0 D U 000000000 00 U‏ 

3000000000 4100000000 םםםםםםםםםםםם 

U 10 D 00 0 םםםםםםםםםםםםםםםםםםםםםםםםםםםהםהםאא‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U ר‎ D 0 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U 0 U U 

020000000 Ger ה‎ DD D D D D 0 0 0 0 DD D D 0 D 0 000 D 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U በ በ በ0] 0 0 0 D U 0 0 0000000 000 U D U 0 U U U 

በ] DDD DDD מ‎ D D D D D 0 0 0 D DD D D 0 0 0 0 0 D D 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 





























































































































በበበበበበበ00000080000090009080809ጩሀቨ 0 0 00 D task struct 
U U 0 U D 0 0 0 D 0000 U 

U U U U D U 0 00000000 000 U D U 0 U DU 0 0 0 00 0 0 0 0 0 U uu 
U U 0 UD 000000 U 
































חההההההאתעגם 42 


Dn D 1 D D 0 םם‎ በገ task struct D D D D D HL D D D Linux D [ [በ በ በ Task] 
በ በ በ L] Process] ה‎ በ] B. በ በ በ በ በ በ task struct 0 0 D d ü d D 7d D" DD DD D" D 
Pog] task struct D D D 00000000000000000000000000000 
uut 
በ] ፲8ኢ82%4119ሀ198በበ1011010000000በ[በ0 D task struct D D 0 D Ú 
በበበበበበ በበ በበበበበበበበበበበበበበበ[በ[[በመጩ በ፲ 1820000000 
OO 528] D D D 0 0 D D D D D DD DD U 28] 000000220000000 
000250 
[ 1,681 11 0 0 D 0 SW) 0 0 0 D D 0 0 D D D D SU D mes ur tr ttu 
םםםםםםםםםםם‎ ROTO 327 0 D D 0 D ne 0000 00000000 DD D 
በበ መ በበበበበበበበበበበበ[በ 
በበበበ በገ 11] Dna 0 D DD 0 00 0 DDD DD 00 DDD D D 0 D 0 D U 
U D DD 0 0 D D DU በበ D 0 0 0 D DD 0 D DD DD D D D D D 0 0 D D D 0 DUD 0 U 
U D DD 0 0 D DD 00 DD DD D D D D D 0 D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 
00000 task struct [] D 0 D D 0 U 
םםםםםםםםםםםם‎ task strut D D D D D D 0 DDD DDD 0 DD D D D 
U D D D 0 0 D 0000 DD 00 DD D 00 D D 0 U 
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0000000 Ale Systen ][ 
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םםםםםם‎ pagel 0 
OOOOU00 SM" D D 
DU D 00 DDD DD በ በ0 በ 0 0 0 D D Processor Specific Gontext[] [ 
































































































































"በ Linux 2200000000000 8s0000000000000 task strut 0 0 0 0 0 0 D 0 
U U 0 0000000000000 U 
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[| | Linux | ul 











e 00000 
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4.3 task struct [] [| [| [J 
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፳] 0 በ በ በ በ በ በ Virtual Mnory[] 


U D D D D 0 0 Kernel Thread] JO00000000000000000000000 
[ mmstruct O00000 Linux 24000000000 active mil 00000000 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U 0000000000000 0 DD 000 0 0 0 [0 ሀ active mi D D 0 0 0 U 
U ፲ በ ፲ በ active mü 00000 mm] [|| 0 ፲ በ ፲ D active nm] [| ጠጠ D D 0 0 በ ቨ 
OOOO 410000 








[] 0 U U U 0000 0 
U 0 0 0 U U 
Struct nmstruct *nm 00000000 
Struct nmstruct *active nm 000000000000 
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ገበበ በበ ገበ በበ 0] Dnes JOOOOOO00000000000000000000 
በበበ በበ ገበ በበ በበ በበ[በበበበ 41 

በ 4.11 000000 

0000 OG 

Int svappable U D 0 0000000000 0 
Uhsi [060 long | ሀ B D D DD mnorQ o 00000 ot en) D U 0 0 0 D 0 ሀ 
nin flat, naj 11%, nswap 00000 
Uisi gned long | D 0 D 0 D 000 DD 0 D DD D D DD D D 000 mnog 
cnin flat, cnaj 11%, cnsvap U D በ ሀ በ (ጮመመሀበሀሀ D 00 0 DDD 0 D 





1110101100 DD ፳] D D 
Dom 2.4] םםםםהםםהםהה ולי‎ 4120000000000000 























H 4.12 000000000 
0000 OG 
Int has cpu םםםםםםםם‎ መ 
Int processor O00000000 መ 
Int lock depth 000000000000 


110 D 0 D D D 0 0 D D 1 በ D 0 በ [] D Processor Specific Context[] 


םםםםםםםםםםםםםםםםםםםםםםיםםםיםםםםםםםםםםם 
Processor] D D ቨ D U‏ בםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
U U 0 D 00000 DU 0 0 0 0 0000000000000 0 DD 000 00 D D 0" d‏ 
በገ] በበበ በበበቨበ”በበበበበ”በሀዘበበበበበበበበበሀ[በበበ;በ[በበ[;ቨበ‏ 
םםםםםםםםםםםםםםםםםםםהםםםםםםהםההה task strut‏ 00000 

OO0O00000000000000000413000 


















































םםםםםםםםם 413 0 


0000 OO 
Struct thread struct *tss 000000 


120 00 


[] 10 struct wait queue *vait chldexit 
םםםםםםם םםםםםם‎ wit4Q QO0000000000000000000 
OOO000000000000000 בםםםםםםםהםםההתהנהתאתקאטאזאצ‎ 
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[] ፲] Struct rlimt rlimiRIMNIMTS] 
בםםםםםםםםםםםם‎ setlimtO ወመ 11:1 םםםםםםםםהה‎ 
[] 3] Int exit code exit signal 
በገ በበበ በበ] በበ 0 D D D D D D 0 D 0 D 0 0 D 0 D 0 D 0 D D D 0 0 D 0 U 
uuu 
[] 4] Char conmh 16] 
U D D D 0 0 D D D 0 D 0 0 D 0 D 0 D 0 D D 00 0 0 U 
[] 5] Uhsi gned | ong personal ity 
Dom 11 11 WON 0 םםםםםםםםהאא‎ ix 00000, 
personality D 0 D D D 0 D 0 0 D 0 0 0 D 0 0 סםםםםםםיםםיםההאא‎ 
PER Li nux, PER Li nux 32H T, PER Li nux EM6, PER SVM, PER SVR3, PER SCCSVB3, PER WSEV 
386, PER I SOM, PER BSD PER XENX[] PER MSKI] [T] [| include] Li nux/ personal i ty. h+] 
(6) int did exec: 1 
በ ጀቨኢበበ በ በ ገ በበበ በበበበበበበበበበበበበበበ0በ[[በ በ በ execve 
U U UD D 0 00 000 U 
[] 7] struct linux binfnt *binfnt 
םםםםםםםםםםםםםםםםםםםם‎ aout] script df] java] 400 
םםםםםםםםםםם‎ task strut DDD D D D DD DD DD D DD DDD D 0 0 
U D DD 0 0 D DD 00 DD DD D D D D D D D D D D 0 D D 0 D 0 D 0 0 D 00 በበ; 
በ በ ה אפם‎ D D D D D D D D D D D ne D D D 0 0 D D D DD DD DD 0 D D D 
U D DD D 0 D DD 00 DD DDD D D D በበ 0 D D D D 0 U 
U D DD 0 0 D DD 00 DD DD D D D D 0 0 D D DD D D D 0 D 0 D 0 D D 00 0 0 U 
U U 
U U 


































































































U DD DD 000 DD DD DD 000 ከ task struct 0 












































4 4 task struct [| 00000000 


task ה‎ D DDD D D D D 0 0 0 DD DDD 00000 DD D D 0 0 0 


441 00000 


000000000000000000000000000QU000000000 
U D D DDD DDD DOOD 00000 TSQ0000000 esti DDD 000000 U 
U U U U 

X8600000000 42000 

0 Intel םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםה‎ 
םםםםםםםםםםםםםםםםנפפםםםםםםםםםםםםםםםםםםםהם‎ 42 
םםםםםםםםםפפםםםםםםםםםהםםםםהם‎ 0 D 0 0 0 0 D ag D ü 
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Ox018f bf ff 


esp 
Ox018f b000 


task struct 


py OxO18f a000 


042 0000000 
D O incl ude/linux/sched h0 ] D 0 D 00 0 0 D D D 


union task union + 
struct task struct task; 
unsi gned long stack] 2408]; 
bi 














BKBp D DDD DD 0 00 task struct NN D D]‏ בםםםםםםםםםםםםם 
task strut NO D 00 D dn‏ בםםםםםםםםםםםםםםםםםםםםםםםהם 
በ1100 BKBD D D 0 D 0 00 DD DD task struct 0 0 l‏ 

task strut 00 D D D 1KD D 0 0 0 D 0 0 0 D DDD DDD 0 DD D D 0 000 U 
םםםםםםםםםםםםםםהםםםםהם‎ ”8J000000000 task struct OOO 
DO0000000000780000000000 

በ task strut D D D D D 0 00 D D D D HDD HD 



































e 00000000000000000000000000 
task struct = (struct task struct *( SIACK PO NER & xf e000 
e IJO0000000000000000 

e task struct D 000000000000000 AŒ SH] 0 0 D D 


442 JO O [] [] current [|] [| 


U D D DD 000 GUD D D 0 0 0 000 DD DD 0 0 0 task strut 0 0 0 D D 
U DD 00000 DD DD 0 D 000 DD D D D 0 linw/include/ i386] current. h [] 
U U U current በ 1 በበ 0 0 በ U D 0 0 0 በ ሀ 


tatic inline struct task struct * get current[] voi d] 

{ 

struct task struct *current; 

. asm [] "andl sp %; ":"=r" [] current] ፡ "0" 0 81910 TD; 
return current; 


} 


— 108 - 





task strueQ D D‏ בםםםםםםע םםםםםםםםםםםםםםםםםםםםם 


uu 
novi SOxffffe000, Yecx 
andi Yesp, Yecx 
novl Yecx, p 


በበበበበበበበበበበ በበበ D D D D D D D D D UD D UD U U U U U U 
task struct [] [1 1| B] D Ú 

U U U U U U U U D U U U 0 current HOOD D D D D D D D UD 0 D D UD U D 0 0 0 U 
םם םםםםםםם‎ current - 1 dD 00 GUD 0 D D 0 D 0 00 DD D 0 

0000 indude i386/processor.h [] 0000000 free task struct( )[] 
alloc task struct( )[][] [ በ በ በ በ በ 8KBO task union] 00000000000 8K 
D task uni on[] [| (1 [] 
































45 000000 


U Hn 0 000000 0 000000 0000000000000 DD 000 UD 
Q task struct[] D 2400000000000000000000000000000 
U U U በ በ በ ]በ] 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
האתםםםםםםםםם‎ 0 0 00 D 0000 0 U 


4.5.1 000 


בםםםםםםםםםםההאאעהםםםםםםםםםםםםםםהםםםםםםם 
חח ה ][ 1[ pi dhash [| incl ude/linux/sched h[]‏ 

#define Pl DHASH SZ [] 4096 << 20 

extern struct task struct ግዝ dhash[ PI NASH SZ]; 


#defi ne pid ከከ] x] OOOO 58] שמאתאהא המאה"‎ - 100 

OOO DUS SZ. D D 0 0 0 D D D D D D 0 0 0 0 D task struct D 0 0 0 D D 
መበ hashfn[] D DD D D D D 0 0 םםםםםםםםםםםםםםםםםםםהםנפא‎ AD 
OOO00000000000 RDMX1000 
በበበበበበበበበበ በበበ በበበ በበበበበበቨ HDD 0 0 D 0 0000 U 
00000 DDD 0 0 D 0 0 D D 0 0 0 0 U 

DH nme U D D D 0 0000000 םבםםםםםםםםםםםהםהשא‎ HDD 00 U 
םםםםם‎ 0 DD task struct [ [ D D pidhash next [| pidhash prev [] ה‎ Ú D 
በ1109 pd DD DD 0000 DDD 43000 

000 pidhashN D D D D D 0 0 D D D D D D D hash pd ) በ whash ₪ ) 


pid] OO 00 find task by pdOO000000000000‏ בםםםםםםםםם 
static inline struct task struct *find task by pid] int pid]‏ 
{ 
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Hull Linux [ LH I 


struct task struct *p, **htable = Spi dhash[ pi d hashfn[] pid] I; 
for] p = *htable; p &&p-»pid != pid; p =p spi dhash next] 








return p; 








1024 


043 0000000000000 


452 000000 


00000000000000 e6d0000000000000000000000 
OO0000000000000000000000000000000000 task struct 
0000 prev task] next task] 00000000000 44000 

















044 000000 


בםםםםםםםםםםהםהםההא SET‏ ם 
Mefine SET INS] p]. do + \‏ 
D H) ->next task = &nit task ነ‏ 
BU -prev task =init task prev task; V‏ |[ 
init task prev task next task =] pj; ላ‏ 
init task prev task =[] H]; \‏ 
U på -p ysptr = NIL \‏ 
if 000p - >p osptr = [|] H] ->p pptr->p cptr] != NII ነ‏ 
U HU - >p_osptr->p_ysptr =p; \‏ 
1፲0]1]-ዌጩ፦ቹቼ cptr =p; \‏ 
wile [ 0]‏ } 
init task] D D D D 0 D D O] pdg OO‏ םםםםםםםםםםםםםםםםםם 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U‏ 


0000000 for each task()] 
#define for each task] ፲] ላ 
for | p = &nit task ; ] p =p ext task] !=Gnit_task; J 
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U D DDD 000 DD DD 0 init task] D D 00 D 00 DD DD 00000 DD 0 U 
U U U UU U D 00 U D 0 00 ቨ በ 

U U 0 U D 0000000000000 0 D 0 በ U DU 0 0 0 000 0 00 0 U D U 
U U U 
































453 OOOO 


GY O000000000000000000000‏ םםםםםםםםםםםםם 
TAKRNN[00000000000000000000000000000000‏ 
U U U UD U U D U U D D U D U D U D roueg D‏ 

45 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
U U U‏ 








task struct task struct t tere L 


045 0000000 








434 000000000 


00000 task struct 0 0000000 rmlistQO0000000000000 

i 0” ide task] 0 0 0 00 D D D U 

U U U U D U D 0 0 0 D 0 0 0 0000 00 U 0 U DU D U 0 000 0 00 0 DU U 

000 ₪ D 0 0 U D U D 0 0 0 D 0 IBD O D በ current 
በገ በ በ U D 0 0 0 0 U 0 0000000 U DU 0 U D U 
U U U UD U U D 0 0 0 0 U 0 0000000 U DU 0 U D U 
U U U U U 0 U מםםםםםםםהםםהםםםהההששש‎ 

current D D 0 0 0 0 0 0 0 D 0 D D 0 U D 0 0 0 D U D 0 0 0 0 U 
[] U U 
[] U U 
[] U U 


m 
o 
o 
o 
o 








U D DD 0 Um 0000000000000000 
በበ ide task[] 0 0 D DDD 0 00 0 D 0000 0 
U U U U U U UU 0 U U U 0 U U U U U U UD 0 U 0 U 
U D 0 0 በበ፤መፀ ጨበ n Dn B B B utt 
U D 0000 በበ በበበ ገበበበበበ1 0 0 TAK RMN NG] [0 O 0 
nr rumi ng [] [| [| | / kernel /fork. c [1 (1 (1 1 [| Ú 

int nr rumi ng] 

0 nr השש‎ 0" D D D 0 D D 0 D 0 0 D 0 D 0 D 0 D D D በ D D nr running] 
ወ በ ገበ DDD 00 DD DD 0 D 0 0 D 0 DD 0 Dm D 0000 Cuir utu 
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U uuu 


455 OOOO 


0 2.400000000000000—0000000000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםםש םםםםםםםםםםםםם‎ 
U [ U 


םםםםםםת 


O incdlude/linux/list. h[] 00000000 
struct list head í 
struct list head *next, *prev; 
bi 
000000000000000 000000000000000 0000000 
0000000 


struct 100 1151 + 
int data, 
struct list head list; 


OO list heed | D D በ በ H nme በበ 5000 
#define LIST HEAD INT] nan] { &] name], &] nang] } 


#define LIST HEAD] nang] ላ 
struct list head nane = 1151 HEAD INT] nanef] 


#0፪[1 ne INT LIST HAN] pir] do { \ 
U pir - next =] ptr]; O ptr] ->prev =[] ptr]: ላ 
} while [] 0] 


#define list entry[] ptr, type, nenber[] ላ 
OO type “O 0 D char 4] D por -[] unsigned long] D &] 0 type *0 0] - renter] O [J 


#define list for each] pos, head] ላ 
for D pos =0 head] - next; pos != [] head] ; pos = pos- next] 

0 20 ገ11100በበበበበበበበበበበበበበበ፲ቧዉሟ ÆADINTOD D D 0 D በ 0 U 
םםםםםםםםםם‎ 2000000000000000000 3000000000 

0000000000 list entry O000000000000000000000 
U U D 000000000000000 000000000000000 

static LIST HAD] runqueue head] ; 

struct list head *tnp; 

struct task struct *p; 


list for each] tnp, Srunqueue head] + 
p =list entry] tnp, struct task struct, run list] ; 
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if [] can schedule] H] | + 
int wei ght = goodness] p, this cpu, prev- >active nm] : 
if D wight > d] 
ር = weight, next =p; 
› 
› 


0000000000 list_entry(ptr, typ, nenber) 0000000 pr L 
OO list heod D D D D 0 0 0 0 םא‎ Da 0 D D D nenberQ O00 הפע‎ D DD HD 
በ D በ list ከመ በ D D D 0 0 0 D type l DD D D DD 0 D D 0 D D DD 00000 0 U 
U U 0 U D 0000000000 000 U 
OOOO list had D D D D D D D D 0 0 0 0 0 D D D D 0 0 0 
list_del()/list_add()/list_ add til OD D D 0 D D 0 0 D D 0 D D D 0 D 0 0 00 U 


U D D 0 D 0 0 D 0 D 0 D D 0 D D 0 D D 0 D 0 0 U 
static inline void del fromrunqueue[] struct task struct * pi] 
1 








nr running--; 
list del] & run list] ; 
p un list. next = NIL; 


T 
static inline void add to runqueue[] struct task struct * pf] 
{ 

list add] &- un list, &runqueue head] ; 

nr runni ng+; 


) 


static inline void nove last runqueue[] struct task struct * p] 
t 

list del] &->run list] ; 

list add tail] Sp run list, Srunqueue head] ; 
T 


static inline void nove first runqueue[] struct task struct * pf] 
1 
list del] &->run list] ; 
list add] &- un list, &runqueue head] ; 
› 
200000 


TAKRINNSN 0 0 D D D D D D 0000 DD DD 0000 U‏ םםםםםםםםם 
U U 0 D U 00 0000000 0 0 D 0 Bag] D D D 00 0 0 0 U‏ 
e TASK STOPPED] TASK ZOMR RD D D D D D 0 D 0 0 D 0 D D D UD D 0 0 0 UD‏ 
DDD D 0 0 0 0 000000000 U‏ םבםםםםםםםםםםםםםם 
D TASK INIFRALPITBLE [| TASK UN NEREP BEN D D 0 0 D D 0 D 0 0 0 0 U‏ ° 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
U U U U D U D 0 0 0 D 0 0 0 0000000000 U‏ 
U U 0 U D U 0 00000000 000 U D U 0 U D U 0 0 0 000 0 00 0 00 U‏ 
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[ Linux [ [] [ 


U U 0 U D 00 0000000 U UD 0 U D U በበ 0 UD 0 0 00 0 0 0 0 D U 0 U D U 
DOO0000000000000000000000000000000000000 
OOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
O000000000000240000000000000000000000000 
U [1] 


struct wait queue í 
unsi gned int flags; 
struct task struct * task 
struct list head task list; 























Es 
typedef struct | weit queue wit queue t ; 


D D D D D 0 0 0 D U‏ 0 0 םםםםםםםםםםםםםםםםםםם 
struct wait queue head +‏ 
w lock t lock;‏ 
struct list head task list;‏ 
bi‏ 
typedef struct ` weit queue head wait queue head t;‏ 


OOO000000000000000000 list heod DDD DDD 2200000 
በ110 220000000 


struct wait queue + 
struct task struct * task; 
struct wait_queue * next ; 
ke 
typedef struct wait queue wit queue t ; 
typedef struct wait queue “wait queue head t ; 


000000000024000 000000000000 22000000000 
0000000000000 00000000000 220 2400000000000 
0 2400000000000000 

e init vaitqueue head] 0 — 000000000000 

e init witqueue entry] OO 0000000000000000 

e witqueue active] | —0 000000000000000 

e add vit queue] D — 000000000000 

e renove wit queue] D —(ü 00000000000 

OO00000000000000000 lis ከመፀ D D D D d ü D D D 
U list del()/list add()/list add 1811()[| [| [| [| 0000 list head I OOOO CH 
በበበ በበበ 220000000 

U U U UD 0 U U D 0 U 0 D 0 U 0 D በ] D 0 D 0 0 0 D 0 U 


sleep ጩ ገበ] 1] በበበ በበቨሀበበበቨበበበ[በበበ Hl 
sleep on] vait queue head t *q] 
1 


ct 




















SLEEP NVR 0000000000000000000000000 
current->state = TASK UN NEFA PII ELE, 


SEP NHD D D D D 0 00 PO D 0 D D 0 DO DO 
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schedul ef] [] ; 

; SEP NAL 000000 םםםםםםםבפ‎ OO 

00000 PD DD DDD TASK UN NR DD BE] ODO Pr 0 0 0 0 0 00 0 DD 0 
DU DD DDD D DDD DDD D 0 00 PD DD D DD D D D 0 0 sleep o 10 DDD D [ 
םםםםםםםםהלם‎ 
e interruptible sleep on ([ sleep on 10 00000 DD 00 DDD DD D 
OO PD D በ በ0 D በ TASK 1 NIERRPO BED 0 ה‎ TASK UN NERUPH RED (] 0 0 U U 0 D 
א םםםםםםםם‎ 
e sleep on tineout( ) [| interruptible sleep on tineout( )[ 00000000 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
OOOO schedule tineout( )[ 0000 50ከ6018( )[ [ D 

OO wake up [| | wake ה ה 6 וש‎ 0000000000000 


TASK RUN NG] D D D D D D D 0 D C] D በ try to wake uf OD D D 
static inline int try to wake up] struct task struct * p, int synchronous] 




















unsi gned 1 ong flags; 
int success =0; 
spin lock irqsave[] &unqueue lock, flags]; /00000 
p state = TASK RIN NG 
if [| task on runqueue[] pi [] DUDU םםםםםםםםהםםבפ‎ 
goto out; 
add to runqueuef] på ; םםםםםםםםבפ םםםםםהםם‎ 
if [] ! synchronous || ![] p »epus allowed &[ 1 « snp processor id] ה ה‎ O 
reschedule ide] n]; 
success = 1; 
out: 
spin unlock irqrestore[] &unqueue lock, flags]; 000000 
return success; 
} 
OOO00000RP0000000000 p0000000000000000000 
OOO000000000000000 የመ[ሕፀበ መፀፀወጩጠበበበበበበበበ[በ[በ[[ pO 
0000000 መጠበበበበበበበበበበበመ 
OOO00000000000000000 wkeup[] vake up interruptible[] [J 
OOOO0000000000000000000000000000000000000 


ORGJOOOOOOO 
static DECLARE WT QHE HAN] rtc wit; D000000000000 























void rtc interrupt] int irq void *dev id, struct pt regs *regs[] 
1 

spin lock] Srtc lock] ; 

rtc irq data = CMS READ) RIC INR FLAG ; 

spin unl ock] Srtc lock] ; 

wake up interruptible]] Srtc wit] ; 


} 
OOO00000000000000 1/0000 Op RAD] D D OG outhyinh] D በ 
-115-- 























[| | Linux | ul 


UUDDUDUUD rtcwitQOOO0000000 
































46 0000 


በ D D DD thread]D O D D O OÙ הח‎ D D D D D 0 0 በ D D ሀ D D DD G nux 
בםםםםםםםםםםם‎ ፳8፪5ከዐህብ[[00[000800”መ OOO00000000 
םםםםםםםםםםםםםםםםםם שיםםםםםםםם‎ 
U U U U D U D 0 0 0 D 0 0 0 0 000 U DU 0 U DU 0 0 0 00 0 0 0 0 0 U U U 
בםםםםםםםםםםםםםם‎ Dms 0 0 0000 DDD 00 00 D 000 0 0 00 L 
U U 0 U 0 000000 000 ቨ ሀ U 
e U UU UU UU DUDUDU 0 UU DU 00 0 UD 00 00 0 0 0 U U 0 0 U U U 


L1 

































































e JOOOO0000000000000000000000000000000 


e בםםםםםםםםםםםםםםםםםםםםםםםם‎ PAGE GED 34 J D 0 
0000000000000000000000000000 48000000 
U D D D D 0 kernel thread 10 0 00 DD D D D 0 0 D 00 D D D D 0 00 0 U 


U U U U 00 0000 000 U D 0 0 UD D 0 0 UD 0 0 0 U 
int kernel thread] int D *fn][] void *[], void * arg, 
unsi gned 1 ong fl ags[] 














{ 


pidt p; 
p =clone] O, flags | GO ON: WO]; 
iff pO /* parent */ 
return p; 
else { /* child */ 
fn] arg] ; 
exit] ቨ ; 


} 
በገ] በበ U D 0 0 0 D 0 0 000000 DU 0 UD U 0 0 0000 0 0 0 0 DU U 
U U U U U 


מםםםם 47 


linux " D [በ capabilityg” םםםםםםםםםםםםםםםםםםהםםםםהה‎ 
םםיםםםםםםטםםםםםםםטםםםםםםםטםםםםםםםםםםםםםםםם‎ 
DO00000”000000000000000000000000000000000 
00000000 ወጪጩበበበበበበበበበበበበበበበበ[በበበ[በበበበበ 428000 
U בםםםםםםםהההאתם‎ 
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በ 4.13 00000 




















































































































































































































U U UU 
CAP CFD/N OO00000000000000000 
CAP DAC OVERRITE O000000000 
CAP DAC READ SEARCH O000/0000000000 
U U 
U U uu 
CAP FOMER םםםםםםםםםםם‎ 
CAP FSEIID O00 setidg setgid[] DODO 
CAP KIL O000000000 
CAP SEIG D OM setgd] 0000 
CAP SETU D OO setuid [] [000 
CAP SEIPCAP O0/0000000000000 
CAP LINK IMITABLE םםםםםםםםםםםםםםם‎ 
CAP NET HND SERM CE | 1] | በ] በ በ በ] 1027410 UP] [1 D በ 
CAP NET BROADCAST O000000000000 
CAP NET ADMIN U D 0 D 0 D 0 D 0 U 
CAP NET RAW OOOO RAW] PATO oo 
CAP I PC LAK בםםםםםםםםםםם‎ 
CAP I PC OER 00 treo D D 00 0 
CAP SYS MDIE O00000000000 
CAP SYS RAWO OOOO iopernt )D iopl( 10 D 1/000 
CAP SYS HOT 0000 chroot( ) 
CAP SYS PIRYE U D D D 000000 ptracel ) 
CAP SYS PACT םםםםםםםםם‎ 

CAP SYS ADMIN םםםםםםםםם‎ 
CAP SYS BAT 0000 reboot( ) 
CP SYS NCE OOO nice 10 D 0 
CAP SYS RISORE U 0 0000000000 
CAP SYS TIME OOO00000000000 
CAP SYS TIY ONIG DUDU tty0 0 

U U D 0 D 0 D 0 0 0 D 0 D D D D 0 D 0 D 0 D D 0 0 0 D D 0 D D D D 0 D 0 0 U 
U U D D D 0 0 0 0 0 D D D D 0 D 0 D D 0 D 0 D D 0 D D U 

DU DDD DD DDD DDD DDD DD CPSYS TME DDD DDD DDD DDD D U 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 








U U U 0 U U 
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OOOO0O000000000000000000000000000000000 
O00000000000000000000000000000000 1000000 
O0O00000000000200000000000000000000000000 
00000000 00000000 SMD D DDD D 00 DD DD 0 0000 DD 0 U 
O0O0000000000000000000000000000000000000 
U U U U DU U 























48.1 OOO 


OOO00000000000000" 000” O00000000000000000 
OO00000000000006nsQQ00000000 dow )[] םםםםםםםט‎ 
םםםםםםםםהם‎ b YD Ul 

0000000000 senaphore 0 O D D በ 0 D include i 386/ senaphore. ከ] 

struct senaphore + 

atomic t count; 
int sleepers; 
vait queue head t wait, 

#f WIIQLELE FRG 

long _ magic; 

#endi f 

bi 
000 count 0O00“ 000” 0000/0” 000 000000000000000 
OO םםםםםםםםםםםםםםםםםטםםםםםםםםםםםס‎ cont QO QOO 
U D D D 0 0 D 0 D በ በ ገበ በበ በ D D D D 0 D D D ገ በ በበ በ በ በ D O [በ Ucount 
םםםםםםםםםםםםםםםםםםםםםםהם‎ 0000000000000 DD 0 0 
U U D D D 0 0 0 D D D 0 0 D U 
Véit [1L] D D D D] D] D 0 D 00 0 D] C] 0 D 0 D 0 DDD DD B. D D. 0 D CE D 0 00 D በ 
OO cout [0000 OOO000000000000000000000000000 
000000 sleepers] 
dom] uD D D D 0 D D D D D D D D D D 0 D DD DDD DD D 0 DDD D D D 


U D DDD 000 U 
O: 








ER 











OOO000000000000000000000000000 


48.2 OOOO 


O0O000000000000000000000000000000000000 
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OOO0000000000000000000000 
100000 


በገ] 0000 በበ ገገ D D D D 0 D D 0 D 0 D D D D D D D D D D 0 0 D UD 
U U 0 D 0 0 0 0 D D 00 D D D D D 0 D D DD 0 D D 0 D 0 0 0 D D 00 0 U 

U D DD DDD DD addr (] (I (I 0 Ú 

e void set bit(int nr, volatile void *addr)[] חש | |[ ה ה הה‎ 

e void clear bit(int nr, volatile void *addr): [] H חח ה ה ה‎ 

e void change bit(int nr, volatile void *addr): הש 00 00 הה‎ 

e int test and set bit(int nr, volatile void *addr): [| | 0 השא‎ 000000 
በገገ]በበ]በበበገ በበበ [በበበ 
e int test and clear bit(int nr, volatile void *addr): הח הה‎ 000000 
































e int test and change bit(int nr, volatile void *addr)[] ה הה‎ nr [1 0000 
U U U U 0 0 0000 0000 000 0 U 
OOOOOOO LOCK הא‎ OOO הש‎ D DD D D D 0 0 0 0 D D D በ00 CU 


በበበበበበበበበበበበበ[በበ SED DD 000000 U 
200000 


Go‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
I DDD D D 0 0 0‏ השס הש 10000000000000000000000 
atomet O00000 414400000000 atome t D D D include/‏ 0000 


i 386/ atomic. H] [0000 
typedef struct { volatile int counter; } atomic t; 


































































































D 4.14 U U 0 U 
U U U U 

atonic read( v) O H * 
atomc set(v,i) O*vO OG I 
Atomic add(i , v) U ם הצ*‎ I 
Atomic_sub(i, v) 1םםחצים‎ 
Atomic inc(v) O*vg 1 
Atomic dec(v) ם**ם‎ DD 1 
ALonic dec and test(v) በሣበበበ 10000000000 100000 0 
Atomic inc and test greater zero(v) u*vg 17000000000 000000 0 
Atomic clear nask(nask, addr) GOO הא‎ O00 addr] |] [1 ቨ Ú 
Atomic set nask(nask, addr) GOO הא‎ [] 00 adi 11 1 rtu 
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םםםםםםםההםהםםםהההה 483 


በ םםםםםםםםםםםםםםםםםםםםםםםםםהםםםםםםהה האם‎ 
םםםםםםםםםםםםםםםםםםםםהםם‎ EO DDD DD 0000 U 
በ Hn 0 0 00 000 0 0000000 0000000 0000000 0000 U 


0000 GUO 0000 הםהםםהםהםהםההםהה הטוב‎ 
unsi gned 1 ong flags; 














save flags(flags); 

cli(); 

/* critical code */ 
restore flags(flags); 
OOOO םםםםםםםםםםםםםםםםםםםםםםםםםםםהםםהםהה*%‎ 
በበበ።በ םםםםםםםםסגט‎ መጩጠጩበበበበበበበበበበበበበበበበ[በበበበበበ 
U D DD መበበበበበበበበበበበበበበበበበበበበ[በበበበ[በ[ 
በበበበበበበቨበበበሀበበበበበበበበበበበበበበሀበሸበሸበ”በበ”በቨ[በቨ 
םםםםםםםםםםםםםםםםםםםהם‎ MOOOOO Cui D 0 0 u 
0 30000000000000000000000000000000" 0000 
OOOO” በ በበ በበበበበበበበበበበበበበቨበበበበበበበበበ[በበበበበበበ 
ו בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 










































































O 10 DDD DDD האפדםם‎ DD D D D D 0 Ger Segnent OOOO 0 H D System 
Seget D D D D D D D 0 0 0 D 
0 29 Dms D D task struct N DD D D D D 0 D 0 0 D D D D 0 0 D 00 DD 0 U 
U D D DUD 000 DD DD 0 Dm D D I 0 task שא‎ 0 D 0 D D 0 DD D 0 0 0 0 U 
በ D D 0 0 በ0 Process] 000 Thread] DD D D D D 00 D D D D D 0 0 D D 0 D D D U 
U D DU D DD D D D D 00 ሸሸ [ 0 task struct[task strut 00000000000 



























































በ]][ DD task אתא‎ JI0000000000000000000000000 
U U U U D U D 0 0 0 D 0 0 0 0 0000000000 00 U 
e TASK RIN NG] D D D D D 0 0 D DUU Feagyt] D 0 0 
TASK I NIFRRPIT HA] N D D D D 0 0 D 0 0 0 NONONO 
TASK UN חקאאא‎ BR] D 0 0 0 D D D D D D D 0. םםםםםםםםםם‎ 
TASK 38810 D D D 0 0 0 0 U 
TASK SIPPE 000000000 
O ቁ] task strut D D 00000000000 880000 
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በ 000000000 UD D D D 0 0 0 D 0 Hn 0 D D current 000000 
U U curemt D 0 0 0 0 0 0 0 0 0 U 
םםםםםםםםםםםםםםהםההאתעםםםםםםםםםםםםםםםםשם‎ 
DOO0000000000000000000000000000000000000 
































0 7] 186. 24000000000 list ₪ I 00000000 CD D 00000 
U U 0 U D በ በበበ በበ በበበ 9 

D&0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 









































0900000000000000000000000 
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111 U UD 0 U 00 LU 








U U U U D U D 0 0 0 DU D 0 0 0 0 D 0 0 0 DUD D U D 0 0 00 0 0 U 0 0 0 0 ሀ U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U ሀበ 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U U 

U U U U D U D 0 0 0 D 0 0 0 0000 U D U 0 U DU 0 0 0 0000 00 0 00 U 
םםםםםםםםםםם‎ Bag 00 0 00 00000 U 






















































































































































































5.1.1 הח‎ E] 


OOO CD DD DD 000 DU 0 D 0 D D RICH C5 0 0 D D UU ORIG Peal Tine 
109110 D D D D 0 0 Gue D 0 0 0 CD DDD D D DD 000 DD DD D D 0 0 0 
U U U UD U U D 0 0 0 በበን 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
በገ በ U D 0 0 0 D U 0 0000000 U DU 0 U D U D U 0 U DU 00 U 
Lin] 0 RCD DD DD 000 DDD DD D D 0 /dev/rtc D D D D 0 0 0 UD 
השא ם‎ D D I 0700 0711/00 000 המא‎ D I /sbix clock] 00000 
בםםםםםםהם‎ 1/0000000000000000 
መገገ በ በ CD D0DDD/'0 00000 DD DD 000 DD DDD 0 0 cpu 
OOO000000000000000000000000  אשהםםםםםםםםם‎ ₪ 
OO000000000000000000 G00000 GQO000000000000 
OO00000000000G00000000000000000000000000 
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OO0000000000000000000 GQOOOOO 

825/82300000/0000000000 בםםםםםםםהם םםםםםםהש 
Gœ0 00000 U‏ 000 = בםםםםםםםםםםםםםםםםםםםםםםםםם 
OO0000 51000‏ 

























































































可 编程 定时 /计数 器 


操作 系统 


8253/82o40000D0‏ 5.1 ה 


םםםםםםםםםםםםםםםםםםםםםטםםםםםםם םםםםם 
םםםםםםםםםםםםםםהא םםםםםםםםםםםםםםםםםםםםם 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 0 U‏ 
U U U በበ] በበ D U D 0 0 00000000 U OOO 118፳8[ 000 D‏ 
םםםםםםםםםםם በገ U U U D 0 0 0 D U 000000000 uut‏ 
D SM£-100M D D D D 0 D 0 D D 0 D D D D DU U U U U 0 U D 000 U‏ 0 
OOOO 10000000 00000000000000000000000000‏ 
O000000000000000000000000000051000000‏ 
GQOO00O000000000‏ םםםםםםםםםםםםםםםםםםםםםם 
O0O0000000000000 000000000000000000000‏ 
GQOO00000000000000000001000000000‏ םםםםםםם 

OO ቹ0[[0000[00 


U U 
U U 
U U 



























































L1 











E=] BG EE EZ ES 23‏ ב 
E= ara uae Eh: ER‏ 
































[] 
0 
U 
0 
U 
[] 
0 
U 
0 
U 
[] 











512 000000 


00000000 השא םםםםםםםםםב= השא‎ GOOOOOOOOOOO 
U U U U 0 U D 00 0000 U 
U D D D D השא‎ GD D D D D 00000 DD D D 0 0 RCD DDD CO00000 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
םםםםםםםםםםםםםםםםםםם‎ RCD 000 U 
Hn 0 םםםםםםםהה‎ እ52000ቁበ00በ0በመ0በበ000 םםםםםהשא‎ 
000 POO BGOOOOO RCD D D DDD 0000 DD IN AN D 00 DD 0 U 
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በበበበበበበበበበበበበበበ0በጩመጩ D D D UD D D REOOOOOOOO enun 
OOOO RCD DD D D DD 0 0 DD DD 860088 RCD D D DDD 000000 U 
U D H nD NON DDD 000 DD DD 00 םםםםהשא‎ 














U U 
U U 





BIOS 
0 RICO ከ 
O0000 








[|] Date] ה ה‎ O O Time] 


052 000000 


U D D DD 00 RCD D D 0 00 DDD DD D D 0 00 D œD D D 00 RCO 00 U 
נבםםםםםםםםםםםםםםםהם‎ RED 0 0 DD D D D 0 D መበበበበበበበ[;ቨበ 
םםםםםםםםהםםםםם‎ GQO000000000000000000000000 
םםםםםםם‎ GQO00000000000000000000000000 


5.13 LimwK[] [00 


OOO00 SOOO 

O0000GSQ0000000070 
00000000" በ በበበ 00000 
O0O00000000000000000 
OOO0000000000000000 


O0O0000000000000000 















































"מםםםםיםםםםםםםםםםםם 


EL BEE 


[] 








[ 





RG) D DD DDD DDD DD መበበበበበበበበበ[በበበበበ[;[‏ םםםםםםם 


U U U U D U D 0 000 U 
በበ በ ጋ 000000 
םםםםםםםםםםת‎ 





U U מםםםםס‎ 
Date] ה‎ [ O O Timef[] 


























*םםםםםםםםםםםם 
NX] Manx]‏ 100 10 19900 בםםםםבפע םבםםםםםםםםםםםםםםהם 


BIOS ה‎ RTC በ0000 
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U D DDD 19709 10 1000 1200 Hn D D D D 0 0 19700 10 1000 000 
































5.1.4 Limx[] 1] 1 [] Ú 


םםםהשםםםםהםההאע ወበበ8‏ םבםםםםםםםםםםםםםםםהם 
DOO0000000000000000000" 0000” OOO0000000000‏ 
OO00000000000000000 1000 0 00 D DD 0 00 D D D D D DU 100‏ 
DDD D 00000 DDD D 0 0 0‏ 10 הא 000000000000 100 U D D‏ 
השע መ0 Mm xD D 0 0 D D‏ 16/ 05000000 00000 
מםםיםעצטונםםםםםםםםםםםםםהםהה החדנ Hn DDD DDD‏ 
O00”00000" 0000” O0000000000jiffiep jiffyOOO00000‏ 


/ kernel / ti ne. cOOOOOG 

unsi gned 1 000 volatile jiffies 

lU jiffies 0 0 0 0 Borse [| DD E H HRH D D D 0 D D יח‎ H 
/include/linux/tine. h[] D 1 U D Ú 


L=]: EJ Eb 









































struct tinespec 1 *ם‎ 00000000070 
long tv_sec; 0*0 D second] ግ] 
long tv_nsec; /* 7000000000 nanosecond] *] 
ዘዝ] 
struct tineval 1 ]በኖ*በ[በ[0[ ኸኝ 
int tv_sec; 0) KÉ 
int tv_usec; /*Q 000000000 microsecond] ግ] 
L 
struct tinezone + CS 11101. Sy 
int tz mnutesvest; *ם‎ 000000000000 “O 
int tz dsttine; /* 000000 ሣ 


J: 
tv sec [ 00 second] D tv_usec 0 በ 00 merosecond] 0 00 0 0 ከ 10000 


tv nsec D [| H O O nanosecond] [000000 10°00 000 tbusec[ tv nsec 0 [J 
OO00000000000000000000000000000000000 
000 Hn JOO000000000000000000000000000000 
በበ] ገበ 000000000000 iiffiesdOOOOOOOOOOOO jiffiesOO 
በበበበበበ በበበ በበ፲፤፻ልመበበበበበበበበ 
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52 OOOO 






































5.21 0000000 


U D D D D 0 DU me D SOOOOOOOOOOOOOOO/OOOOOOOOOOO 
U D D 0 00 GUD D D 000 DDD DDD 0000 D DDD 00000 D U 
בםםםםטםםםםםטםםםםםםםםםםםםםםםםםםםםםםיםםםם.‎ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎  אחםםםםםםם‎ 
םםםםיםםםםיםםםםםםםטםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U U DU U 

53000 בםםםםםםםםםם 














IRQO 


[] CPU 
8259A 1 


0000 
1.93180MHz 
8253/8254 Dran D 0000000 





05.3 82539 הצ‎ D D D D] D D 


OOO00000000/000000000000000/0000000000 
םםםםםםםםם‎ 3000000 Qt Gti] GMO 0 D D D D 0 0 0 00 D U 
נבםםםםםםםםםםםםם‎ G0JQ0000000000000000000 ₪ 
በ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםס‎ 
םםםםםםםםםםאסטםיםםיםיםםיםםםםםםםםםםםםםםם‎ 
םםםםםםםםםםםםשש נבםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U D U U D 0 0 0 D 0 0 0 0 U 00000 00 0 U DU 0 U D U 0 U 0 U D 0 U 
U U U UD D U D 00 U D 0 U 


© CO C 
Fog 
= 

































































EILER E23‏ נש 
EI EET ERT‏ 
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522 Dms U 000000000 














ዝበ በበበበ/በበ፲በበበ[በ 


IBMCO D D 00 82530 2000000000000000000000000 
0000000000000 51000 




















[ 1 8253/ 82544 00000 
U U U U U U U U U U םםםםםםםםםם‎ 
Uu o 0x40 םםםםםםםםםםם 3 ם‎ 
U U 
U U U U 0 U 0000 םםםםםםםםםם‎ 
0001 Ox41 OU 2 U U U 0000 
0002 0x42 ם‎ 3 00000 
00000 0x43 / OO 2530000000000 
0O00 00 0 0 D 00 5.300 תשא‎ D 0 D D D 0 D D 0 D D 0 0 D האמו‎ 3 


00000000 0 ከ ከ /arch/i 386 kernel /i8259.cQ init [፻[]00000 
set intr gate] 0820 interrupt[O][] ; 


0*0 1000 הפא‎ 0000000000000000000000000000 
OOO00000000000000000000000% 


outb pi] 0x34, 0x43] ; /* 0000 םםםםםםםםםס‎ 2 

outb p] LAICH Oxff , 0x400; | /* 00000 LB echt E 

out] ለሸበ፲ሙ8, 4; /* 00000 *םםםםםםםהפא‎ 

LAID D 0 D D 0 D D 0 0 DD 0 DD 000 D 0 םםםםםםםהס‎ 000000 በ 


[] /include/linux/tinex. h[] ] חחח‎ 

#iefine CLOCK TICK RATE 1193180 /* 0 5.3000000 * 

#defi ne LA 0 D COCK TICK RATE + H 27 /HH /*በበ0 000000 ሣ 

UOK H GK הא‎ OO 85300000000 530000 1.193180M OOOO 
IME D | 0 O በ 0823000 30 D D D D 0 0 0 D 0 D D D D UD DD D 0 000 DD D U 
U U U U 0 U D U 

HED D D D D 00 0 DDD 0000 D D D D 0 0 000 O00 /inelude/asniparamh 


Dunn: 
#defi ne HZ 100 


2J0000000000 


O0O00000000000000000000000000000000000 
U U U DD U D 0 0 0 0 U 
e 0000000 tine interrupt] OO 
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e םםםםם‎ 1 01 0 do tiner interrupt(); 
e DODO do tiner[] OO 
e [00000 በ setu ፤፲ቭ] 2 
e ם םםםםם‎ ret fromintr[] [] ; 
በ 300000000000 
tiner interrupt] [] 
































do tiner interrupt( ) 


do tiner[] [] 
0 10 ti ner interrupt] [j 
םםםםםםם‎ 10s 0000000000 tine interrwtg (100000 D D 
U DD D D 0 0 D D D D 0 [በ] 0 DD D D 0 0 D D 0.0 D D D 0 D 0 D D 0 0 D 0 D 0 U 
U DD DDD DD DDD DDD DD 0 D D በ በ do tiner interrupt OU I [] 
[] 20 do tiner interrupt() 
do tiner interrupt O] D D D D D D D D D D D D D D dotiner 0 DD 0 D D D 
በበ 0 DD መሚ D 0 D D D 00 D 0 DD D D D 00 D በ /arch/i 380/ kernel / ti ne. ch D 
U D D D 0 0 D DD 00 DD DDD D D D 0 D 0 D D 0 UD 


static inline void do tiner interrupt] int irq, void “dev id, struct pt regs *regs[] 
{ 


L1 






































do tiner reg]; /*OOOOO000000000000000000* 


if xtine. tv sec >last rtc update + 660] 
update RIG); 
Oo 400000 ROOOOOOOOOO eum መኸጠበ[በ[00[0[0[0[11[[0 
6600 D xtine.tv sec I) ה‎ [| [| D last rtc update] 00000 הההההשא‎ * 
} 


D D D Stim (000000 tiva 000000000000 
030000 do tiner() [| [] / kernel / sched. c [] [] 
void do tiner[] struct pt regs * regs] 
1 

jiffies‏ 00000000000000*/ ;+ ה[1116א |* unsigned long‏ ]* ם 
*םםםםםם 

update process tines(); 
Host ticks; 
iff ! user node [ regs [| D 
Host ticks system 


mark bh] TI MER BI; 


if [] tq ti ner[] 
mark bh] TAFE BH] ; 


} 
O D በ update process tins] D D 00 D D D D 0 0 0 D D 0 D D D D 0 0 0 0 U 
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U U 0 U 0 000000 000 ቨ ሀ U 
counter 00000000000 
U U 0 0000 U 
U U U U 0 U D 0 000000 U 
U U 0 U 0 000000 000 ቨ ሀ U 














tiner interrupt() 


U U U U 00 DU 000 DD U U 00 0 D 0 U 





U U U U U U D U 0 0 0 U D 0 U ፲ couter D U 
U U U በበበ በበበ በበበ በሀበ በበ 0 U D U 


U U 0 U D U 0 000000 ה‎ UU 0 U D U 
U U U በ በ U D 00 0 0000000 00 0 U D U 
U U U U 0000 U U 000 U 











U U D U D U |[በ D UD 0 D 0 D 0 D 0 D 0 0 0 0 በ 
00000000000 lost ticks] lost ticks system] [] [| [] [| [| tiner bh() 


O0000000000000000000000000 10s0 00000 tirer bh) 


U U 0 000000 U 


tirer BOOOOOOOOOOOOOOOOO‏ םםםםםםםםם 


U DD DDD 0000 DD DD D DD D D D 0 Olost_ticksQ D OD tiner ה(‎ O00 


U U 0 U 0 000000 000 ቨ ሀ U 


DDD lost ticks systenl]‏ םםם 0 םםםםם 


በበ tiner םםםםםםםםםםםםםםםםםםםםםםםםםםםםההה(ם‎ 


O40000000 
U U U U D U D 0 0 00000 U 


























U U U U D U D 0 0 00 0 በበበ በበበ U 000 U 


D0000000000000000000000000000000000000000 
O tine init OD D O 0 /arck/i 386/ kernel / tine cOOOOOOd0OOD 


void init tine init[] void] 
1 
xtine. tv sec-get cnos tine(); 
xtine. tv usech 


setup irq] 0] | 1፲ባ፲[] ; 
) 


000 get cms time OD D D D 0 0 0 D D D D D D QWR D 00 DD D D 0 xtine 
םםםם םםםםםם‎ setup irai 0] Dire) D 0 D D D D 0 0 0 D D D D 1ra0 D ቨ ከ 
U U U 0 0 D U D D 0 0 0 ששו‎ | D D D 0 DU D D 


static struct irgaction irq0 


= tiner interrupt, SAINFRRPT, O, "tiner", NIL, NIL); 


setup ird] 0, &rq0] [| D [| D /arch/i 386/ kernel /i rq. c(t] D 0 D D 0 D D 0 D D 0 
DOO000000000000000000000000000000 


በገ] U 1 0010900000; ሀ U 


O0O000000000000000000 


OOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000 





do tiner interrupt] D םםםםםםםםם‎ 00 

1 
SAVE ALL םםםםםםםםם‎ OO 
intr count += 1; 00 0000000000 00 
tiner interrupt() 00 00000000 OO 
intr cout -= 1; 
jnp ret fromintr םםםםםם*!‎ uu 


} 
00 03 mp ret fromintr DD DD 0 00 DD D D D D 0 D 00 DD DD 000 0 U 
jnpret fromsys ca INO DD D D D 0 0 D 00 D 0 D 0 0 0 D D D D D 0 0 D 0 DD በበ 
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| ום ום‎ 
OO0000 jmp ret fromsys call] 
3111101010 በ 0 


ከ ከ ከ ከ [ /arch/i 386/ kernel / entry. SJ‏ םםם םםםםם 
ENRY] ret fromsys call]‏ 


















































cli # need resched and signals atomic test 
cnpl $0, need resched] bx] 
jne reschedule 


cnpl SO, si gpendi ng] bx] 
jne signal return 

restore all: 
RESICRE ALL 


ALIGN 
signal return: 
sti # ሄይ can get here froman interrupt handler 


test] $] VMMSK] , EFLAGS] "esn 
novi %sp, Yeax 

jne v86 signal return 

xorl %dx, Yedx 

call SYM NAMI | do signal [] 
jnp restore all 


ALIGN 
v86_signal return: 

call SYMBOL NAMM] save v86 518181] 
novl %ax, Yesp 

xorl %dx, Yedx 

call SYM NMH] do si mal [] 

jnp restore all 


reschedul e: 
call SYM NAME] schedul ef] #1651 
jnp ret_fromsys call 


ret fromsys call] |]‏ "םםםםםםםםם יםםםםםםםםםםםםםםםה 
OO0000000000000000000000000000 ret fromsys call 0 D [‏ 
U D DD 0 0 D DD 00 DD DD D D D D D 0 D D D D D D D 0 D 0 D 0 0 D 00 0 0 U‏ 
U D D D 0 0 0 U‏ 

Q 10 ret fromsys call] OOO 

l 20 reschedule] [] D 0 0 0 0 D LU D D DI 

l 3] signal return] 0 (] DD 0 0 DD 0 D D D DU 

v86 signal return] OOOO መበበበበበበበበበበበበበ[‏ ]4 ם 

በ 50 PSIGEAU J0000000000000000000000000000 
U D 0 D 00 D 000000 U 

በ D 1 ret fromsys call] D D D 1 1 D 0 D D D J D need resched](] 0000 
U D DD 0 0 D 0000 DD 00 D D DDD D D D 0 D D D D D D D 0 U 
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OO0O0000000000000000000000000010Q/00000 
OOO00000000000000000000000000000000 
OO000000000000000000000000 CO 00000 U 
O0O00000000000000000000000000000000000 
00000000 6nsQQ0000000000000000000000 
OOO00000000000000000000000000000000 
U U U U U 

























































































53 Iinux[] ה‎ ] 1] — Schedule] |] 


O0O00000000000000000000000000000000000 
0O000000000000000000006nRQ000000000 


53.1 OOOO 


በገ] በ D U D 0 0 00 0 000000 U DU 0 U DU D U 0 000 0 0 0 0 U U U 
000 GOD DD D D DD D D D D D 0 D 0 0 0 0 DD 0 0 0 D D 0 D D D OO Scheduling 
השסחסה‎ D 0 D D D D D 0 0 DD D D D DD 00 DD DD 000 DD DD D D 0 0 0 
[| D Scheduling Policy D D D D D D D 0 0 0 0 D D D D 0 0 0 D D D 0 0 0 mx0 0 
U U 0 U D 0000000000 U 


0200000 GY D D D D D D D 0 00 D D D euin 

םםםםםםםםםםםםםםםםםםםםשם 

04000000000000000000000050 

U200000000000000000000000 

በበበ ገበ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם5‎ 
םםםםםםםםםםםםםםםםםםם‎ መጪጨእበ[000[0[00[0[ 0 5.26200 0000 
U D D D በ0 Wndows D D 0 0 D DD D D 0 0 

U U U U DU U D 0 0 00000000 000 U 


םםםםםםםםםת 


U DDD Tine םםםםםםםםםםםםםםה וצ‎ 
U U U U D U ND 0 D 0 0 000 0 DU U D U 0 UD 00 00 0 0 0 U D 0 0 U D U 
U U 0 በ 0 0 0 D 0 0 0 0 0 0 0 0 D 0 0 DU 0 0 D D U D 0 DU ሀ 0 0 U D ቨ 0 ሀቨ U 
םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ GOD D 0000 DDD U 
םםםםםםםםםטםםםםםםםם‎ መበበቨበ መበ በበበ በ DU 000000 U 
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U U 0 U D 00 0000000 U UD 0 U D U በበ 0 UD 0 0 00 0 0 0 0 D 0 0 U D U 
DOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
O0O00000000000000000000 


2J0000000 


DOO000000000000000000000000000000000 
OOO000000000000000000000000000000000 
U U 0 UD 000000 U 
በ1[[00:[ በ በቪ; D D ቢበ 0 DUU Nnpreenptive Schedul i ng] 

DOON NO NO GUD DD 000 D 00 DD 0 DDD 00 D 0 0 
U U 0 U D 00 000000 D U D በበበ በበ 0 0 000 0 0 U 0 በበበ; 
OOO000000000000000000000000000000000 
U U 0 U D 000 U 
םםםםםםםםםםם‎ DDD D 0 00 Preenpti ve Scheduling] 









































nm 


U U U 
U U U 


U U U 


ET E? 
EE 
ELE 


EET 


Oo 


ooooooo H ₪ 
ם‎ ; ₪ ₪ ₪ ₪ ₪ ₪ aB כ‎ ₪ 


[-l ET 


























































































































o 
o 


OOO0O0000000000000000000060Q000000000 
םםםםםםםםתת‎ 


U U U U D U D 0 0 0 D 0 0 0 00 DU U D U 0 UD 00 00 0 0 0 U U 0 0 U U U 
U U 0 U D 000000000 U UD 0 U D U 0 0 0 U 00 0 00 0 0 0 0 D U 0 U D U 
U U U 


410000 


OOO000000000000000000000000000000000000 
DO0O0000000000000000000000000000000000000 
OO0O00000000000000000000000000000000000 
O0O00000000000000000000000000000000000 
D0O00000000000000000000000000000000000000 
םםםםםםםםםםםםהאת םםםםםםםםםםםםםםםםםםםםםם‎ 
םםםםםםםההאבתעט בםםםםםםםםםםםההה האתטםם‎ 
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5.3.2 Limx[] (H [] [] 


O0O0O0O000000000000000000000000000000000 
Dot 00000000 940 םםםםםםםםםםםםםםםםםםםםם ה ה‎ 
OOO0000000000000000000000000000000000000 
O0O00000000000000000 

D meU [111111 0 0 U 

םםםםםםםםםםםםםםםםםםםםטם 

02000000000000 D current- Seounter-0]] [] 

03200000000 

םםםםםםםםםםםםםםםםםםםםםצם 
םםםםםםםםםםהםםהםםהםםםםהה ה 0 OO 1000000 sleepON‏ 






































OO םםםםהצםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
OO 0000000000000000000000000000000000 
U D D D D 0 0[] הת‎ D D D 0 0 0 D D D D D D 0 0 schedleQOOO 1! 














በበ 400000000000000000000000000000 
ret fromsys call 00 D 0 DD D D D 0 0 0 0 0 D D D D 0 0 0 DD DD D D 0 00 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 





U U 0 U D U 0 0 00000 UU 0 0 D 0 DU D U 0 U D U D 0 0 0 D 0 0 0 0 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 






































U D D DD 0 tiner התא‎ NONONO 2 D D 0 0 D 00 D D D D 0 0 0 0 U 
DU D D [በ በ [በ [በ schedule()[] ዐዐ tiner()[] ret formsys cal!lün 00000000 
0 30000 
e schedule) D 0 D 0 00 D 0 D D 0 0 D D 0 DD 000 0 U 
e dotirer)00000000000000000000000000000000 
00000000000000000000000000000000000 100000 
ם‎ 1000 በ በ 1008 [] 
e ret fromsys call 0000O000000000000000000000000 
O0O00000000000000000000000000 
0 30000000000000 
OOO0O0OOO00000000000000000000000000000 
do tirer)0[0000000000000000000000000000000000 
U U Goum er 1101110000 U 
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DD 00 DD D 0 D 0 D 0 0‏ ה ה ret fromsys cal‏ םםםםםםםםםםםם 


םםםםםםםםםםםם 
cnpl $0, need resched‏ 
j ne reschedule‏ 









































restore all: 
RESTCRE ALL 


reschedul e: 
call SYM NMH] schedul ef] 
jnp ret fromsys call 


000000000000 need resched 0 0 D 0 0 D D D 0 D O00000 
reschedule] 000000 schedule 00000000000 schedleOO OOOO 
O000000000000000000000000000000000000000 
OO00000000000000000000 OG 000 00000000 RESICÆ AL 
OO000000000000000000000000000000 
O0000000000000000000000000000000004000 
00000 
000000000000000 ret fromsys cllO0 000000000 
O0000000000000000000000000000000000000 
OOO000000000000000000000000 ret fromsys call()0 0 
O0000000000000000000000000000000000000 
O0000000000000000000000000 
Dn 00000000 NXOOOOOOOOOOO" nce level” 000000 
0000000 OO priority D 0 D 0 0 D DON Gag D 0000000000 Found 
Robi ng 00 ה‎ D 0 0 D D በ በ በ በ በ D በ D DD DD D D 00 bothsooner and1 onger [JD 
U DDD Wxgo00000000000000000000000000000000 
0000000000 real tine” [000000000000000000000000 
O000000000000000000000000000" nice levd” 00000 
U DD D 
U D 0 0 Gm JO00000000000000000000000000"00 
U "DDD 0 U 


























0 
U 
[] 
0 


EE 221.2] 

























































































9.33 0000000 


በበ] U U 000000000 0000 0 0 000 0 U D 00 U 0 D 00 0 0 0 U 


በበበበበ በበበ በበበበበ[በ[በበ በበ task strut (0 0 DD 500 
need resched] nice] counter] policy D rt priority 


[] Mneed resched: 0 0 D D D D D D DD D 0 0 0 D D DD D D 10000 schedul e0) በ 
ם‎ 1] counter: 0 D D DU 0 0 0 0 0 D D D D D D HL 
በበ בםםםםםםםםםםםםםםםש‎ 00000 need resched D I 100000 
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ם"םםםםםיםםםםםםםהםם 
DD DDD D counter በበበበቨበቨ በ በ መርዩ(ን[‏ "םםםםם "םהה ር‏ 30 
POSIX 1b sched setparant) [| 5. 4BSD SVL set pri ori ty/()] 000 000000000‏ 
uuu‏ 
በ] 4] rt priority: 00000000‏ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהה በ 50 policy:‏ 
በበበ] ገገበበበበበበበበበበበበበበበበበበበበበበበ[;;‏ 
sched setschedul ef] 1111111111 DO 0 0 0 0 0 D 0000 00 DD 0 D‏ 
D 0 D በ D nu‏ 0 ה U D 0 0 D 0 DD DDD DD 0 D D 0 D 0 D D D conter]‏ 
HOn DD 00000 0 D HC 0000 0000000 0‏ 00000000000 
U D 0000 DDD DD 000 DDD D 0 D 0 DD D D D D D Om 0 D 0 0 U‏ 
D D D 0 D D D D 0 D D 0 D 0 D D D D D D 0 U‏ האש םםםםםםםםם 
U U‏ 
በበበ1]0ጩበበበበበበቨበ 0000” 00000‏ 
U‏ 
U‏ 





















































O DD Hn DDD DD D" 0 D 0 0 "0 D 10800 
U U 0 U D በ ፲ counter [| [] [D U በገ U U U D 00 0 0000000 00 0 U D U 
counter 0 D D D D 0 0 0 DD DD DD 5000000000 הל‎ OOOO 
Dom 2.40 D 0 D D D 0 0 0 DDD D 5008 


































































































0 
0 
0 
U 


93.4 0000000000 


| D goodness] D DDD D D D D 0 0 0 D D D D D 0 D 0 D 00 D D DU 0 0 0 D 
םםםםםםםםםם‎ 50 0000000 DD DD 0000 D D D 00 0 wightii) ood 
U U U UD U U D 0 0 0 D U 0 0 0000000 በበበ U D U 0 U D U DU 0 U D 0 0 0 U 


U U D D D 0 0 0 0 0 D D D D 0 0 0 0 0 U 
static inline int goodness] struct task struct * p, struct nmstruct “this nm] 
{ int vei ght; OO በበበበበበበበበ[በበበበበ[በ[በበ d 


wei ght = 1; 
if [] p ol i cy&86CÆD YI HD] 
goto out; /*Q000000“000yiddd” 00000000100 
sw tch] p »pol i cy] 
1 
*אםםםם*!‎ 
case SCÆD H FQ 
case SCÆD RR 
weight = 1000 +p-=xt priority; 


1° HO mA. 27 
case SCÆD (፲፲፲5 
{ wei ght = p- >count er; 
iff] ! vei ght[] 
goto out 
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*םםםםםם*! 
if [] p >mm=this m) ! p- amb‏ 
vei ght = vei ght +;‏ 
wei ght +20- p- >ni ce;‏ 


} 
out: 


return wight; /*0 000 */ 


} 
U U U U ee eee 
#defi ne SCÆD AHR 


#lefi ne SCHED H FO i 
#lefi ne SED FR 2 
#lefi ne SCHED YIELD 0x10 


םםםםםםםםםםםםםםםםםםהשוע םםםםםםםםםםםםםםם 
DDD DD 0 0 000 DD 0 U‏ ה OOO000000000000 10001. conterQ‏ 


0100000000000000 Gamp 000000 DDD D 00 DDD DD 0 U 
U DD 00000 DD DD 0 D 0 00 p ami hS mi DDD D D D 0 0 0 00 DD 0 U 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 1; 








0 
U U U U U U D 0 0 0 D U 000000000 00 U 
በገ U D U D 0 0 U D 0 000000000 U 














































































































9.35 0000000 


በበበበበ በበ DD DDD D DD DD DDD DD DD DDD DD DD DDD DD SW 
U U U D 0 U 

asmi nkage void schedul ef] voi d] 

{ 


struct task struct “prev, “next, *p [] * previ] ה הה‎ Hn n. 


XI‏ 00 00 0 0 0 0 הת 
struct list head *tnp;‏ 
int this cp, c;‏ 


if [] !current- “active mi] BB);/*0 ה‎ 00000 active mm] [] [] [] 0 ግ] 
need_resched_back: 


prev = current; 0*0 בםםםם האא‎ ግ 
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this cpu = prev- >processor; 


if QininterrutQO ብ] ግ] በ 5ዉጤፀ0ቭፀዩ111101000010000 00 
O0000000* 
pri nt k] "Scheduling in interruptyn"[] ; 
BA), 


› 
rel ease kernel lock] prev, this cpu]; /*GO 000000 
OO this cpu[ ሀ D *[] 





spin lock ird] &unqueue lock]; በማገ በበ በበበበበበበበበበፆ” 
if D prev- policy = SED RR] IAU 00000000 SA RIO 
goto nove rr last; םםםםםםםםם‎ ግ 
nove rr back 
switch [| prev->state] + O*00 pe 1 [00000000 
case TASK INFREPIRE /ገበበ በበ በበ በበ በበበበበበ” 
if D signal pendi ng] prev] O (/*0000000000 





*םםםםםםםםםםםםם 
prev- state = TASK RIN Ng‏ 
break;‏ 
} 
default: O*U0000000000000000*0‏ 
del fromrunqueuef] pre]: D >D 00000000‏ 
case TASK RNVNG;0 “11 0 D 00 0 D 000004‏ 
T‏ 
prev- >need resched = 0;‏ 


0* םםםםםםםםםנים 
repeat schedule: U X D 0 0000000000 al‏ 
*הההםה הה > next “idle task] this cpu]:‏ 
c = 1000;‏ 
if [ prev->state = TAK RIN Nj]‏ 
goto still running;‏ 
still running back:‏ 
O O ሚ]‏ הבה ]11 [ + list for each] tnp, &unqueue head]‏ 
p =list_entry] tnp, struct task struct, run list] ;‏ 
UU D UD DD FO‏ הטש 0*0{ if 0 can schedule [] p 185ጩበ በ‏ 
int wei ght = goodness] p this cpu, prev->active nmh|;‏ 
if [] wight >]‏ 
ር =weight, next =p‏ 


} 
} 
O*O0 c0 ብጠበበበበበበበበበበበበበበበበ 00 0000000000 0 
סי םםםםםםםםםםםםםםםםםםםםם‎ 
if שס!ם‎ 1 


struct task struct *p; 
spin unlock irq] &unqueue lock] : 0 ግ] 00000 *0 
read lock] &asklist lock]; በ*ገበበበ ሀ በበ በሚ 
for each task] p0 O*O00000000*0 
p->counter = [] p »eounter << 1] + NC TO TIO] p ni cel] ; 
read unl ock &asklist lock]; 
spin lock irq] &runqueue lock] ; 
— 138 — 





















































goto repeat schedule; 


spin unlock ird] Srunqueue lock] ;0 "1 0 D 0 D D 0 00 00 0*0 


if [] prev = next[] + *םםםםםםםםםםםםםם‎ 
prev- >policy & ם-‎ YIHD 
goto sane process; 


O*OO00000000*0 
kstat. context swch+ DO D 0 0 D u 0 D u A 


1 
struct nmstruct “nm = next- nm 
struct nmstruct *oldnm- prev- “active nm 
if tn) + O*O 0000000000 prev] DD D D D 
if [] next- active nm] BA); 
next- “active nm = ol dum 


} else {OO 00000000000 nex 00009 
if [] next- active nm! = mf] BA); 
switch nm] ol dom nm next, this cpu]; 

} 


if D !prev: am (10 >D D D D 0 0 0 0 0 0 0 0 "D 
prev- “active nm- NIL 0 *0 D DD 0 0 D D D U U *D 
nmdrop] ol dnmi] ; D *nmstructQ D HH DD D. PO 


} 


switch to] prev, next, prev]: D >D 000000000000 
. schedule tail] prev]; [] ሻኻ] prev->policy[] SCÆD YI HDI] 


sane process: 
reacquire kernel 1068[ current] ;[] ሚ] 0 SMD 
if [] current- need resched] U >D 00000000 ሚ] 
goto need resched back; םה 1* ה‎ 00 0 “0 
return; 


} 
OOO000000000000000000000000000 
በ1100 
e [000000000000000000000000000 
በ] D D በ በ 9190 םםםםם םםםםםםםםה ה ה‎ 

- DBOOOOOOOOCOOOOOOOOOCOOCOOOOOO 
00000000 schedleQOOOOOOOU00 0 TAKRNG] D D D 0 exitOD D Ú 
םםםםםםםםםםםםםםםם‎ TASK MTT D D DOO wit4O0 00000000 
U DD DDD [ [0 [0 התתמחקאטאואצ‎ D D D D D 0 D 0 0 D D D D 0 0000 0 U 
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U UU D 0 0 0 U 


U U U U DU U 
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U U 0 UD 000000 U 

e U UU UU UU DU 0 U DU DU 0 U DU 00000 0 ሀቨ D U 

- 000000000000 OGOO00000000000000000000 
םםםםםםםםםםםםםםםםםם‎ 100 DD 0 0 DD 00000 DD D D 0 00 U 
በ10 NŒ PTS D 0 0 0 D nice DD DD 0 0 0 

e U UU UU UU DUDUDU 0 U D U 0 0 0 0 D D ሀ U U next- am] 
next- “active mq] D D D D D swtch ₪ OO00000000000000000000 
00000 met 0 U D U 0 0 U 0 D ሀ ሀ ሀ U U U D nest- ama 0 D D 0 U D 0 0 0 DL 
U U 0 U DD DD DN U U D 0 U D U 0 በ ሀ ሀ በ በ ሀ በ ሀ ሀ በ ሀ previ [ ቨ D U 
U U 0 U D 00 0000000 U DD 0 U D 00 0 0 U 00000 U 

e DO םםםםםםםםםםםםםםםההה םאפ‎ 
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OO00000000000000000000 GOD 0 0 00000000000 
U D DDD 0000 DD 000 DD DDD DDD DDD 0 0 00 በ በ Intel በ i3860 0 
U U U UD U U D 0 0 0 D U 0 0 0 U 00000 00 0 U 0 U 0 U D U 0 U 0 U D 0 U 


5.41 OOOO 


Intel 1386 | | ]1]111 1 1011011101010100 0000 S000 54000 
OOO0000000000000 14000 TSSO D D /include/ i 386/ processor. h[] [] 
QO tss struct [] [| [| 
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D 5.4 Intel 1386በ በ በ በ በ በ חא‎ 





























struct tss struct + 
unsigned short back link, blk; 
unsigned long esp0; 























unsigned short ss0, ssoh;Q *OOQ 00000 D nme [] 
unsigned long espl; 
unsigned short ssi, sslh *ה‎ 19 00000000 
unsigned long esp2; 
unsigned short ss2, ss2b []|* 27 *ההההה הה‎ 
unsigned long 3 

unsigned long ₪ 

unsigned long  eflags; 









































| DU U 





I/O Permission Bitrmap Offset | 000000000000000 [1 
0000000000000000| ur | 
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unsigned long eax, ecx, edx, ebx; 
unsigned long ₪ 

unsigned long ebp; 

unsigned long esi; 

unsigned long edi; 

unsigned short es,  esh: 
unsigned short cs, | 
unsigned short ss, ₪ 
unsigned short ds, | 
unsigned short fs, ₪ 

unsigned short gs, _ gsh; 

unsigned short ldt,  ldth 

unsigned short trace, bitnap; 

unsigned long io bi tnap[ IO H TMP SI ZEH]; 


* pads the TSS to be cacheline-aligned [] size 15 081001] 

+j 

unsigned long _cacheline filler[5]; 
L 
OO 0000 80000000000 Task State Segnent Descriptor D [ [| 
ጨበ በ1በበበገ 0 D 00 00000 2O0000002000000000000 
U D DD 10490 s0000 00000 Sibol GO 000 GJ GOOG 


U U 
U D D D D 0 0 Ex DDD D DD 0000 Tù D D 0 D 00 DD Dms I 00 D 


0000000000000 thread struct OOO 
struct thread struct + 
unsigned long — espO; 
unsigned long ₪ 
unsigned long ₪ 
unsigned long fs: 
unsigned long gs; 
/* Hardvare debuggi ng registers */ 
unsigned long debugregl 8]; /* 998b0-7 debug registers */ 
/* fault info */ 
unsigned long  cr2, trap no, error code; 
/* floating point info */ 








uni on 1387 uni on 1387; 
/* virtual 86 node info */ 
struct vn86 struct * vn$6 info; 
unsi gned long screen bi tnap; 
unsi gned 1 ong v86flags, v86nask, v86nøde, saved esp0; 
/* IO pernissions */ 
int ioperm 


unsigned long io bi tnap[ IO H TMP SI ZEH]; 


L 

0000000000 cr20 DDD DDD 000000000009 Intel 80x86 0 
םםםםםםםםהםםםםםםםםםםםם‎ ፤ጩሟ ה‎ በ iQ OO000000 
በበበገበበገበ በበ በበበ םםםהםםםםםהנסע‎ eflagi D Og תת‎ 
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0 300000000000000 םםמסע 000000 םםםםםםנסע‎ 
በገ U D U D 0 0 U D 0 000 U 
U U 00000 DU DU DU 0 00 D IOD D 0 D D 0 0 0 0 0 D 000000 0 U 
OO“ 000 "000 DUD DU Tù 0 0 0 0 00 GY OO000000000000 
U DD DDD 00 DDD DDD TRD D D DD TRD 000 TSSID D 0 0 0 D D D GOUD D 
ooo JMO םםםםםםםםםםםםםםםםםםםםםםםםםםהםהנה:צ‎ GT 
00000 םםםםםםםםםםםםםםםהםה‎ 
Intel םםםםםםםםםםםםםםטםםםםםםםםםםםםםםםםםםםםה‎ 
13860 D D D D 0 0 0 0 GS DDD JMOOO GD D D D D D D 0000000 U 
םםםםםםםםםםםםםיםםםםים‎ 30000 0 DD D D ፻፻[ D D 120 CU 
U D UD በ D 0 Hone D DD D D D 0 0 138 GOD D D D D 0 0 0 0 DU 
ם‎ D i386 GUD D D D D D TRO TS H ne D 0000" "םםם‎ DD CU TRI TS] 
000 GUD 0 0 0 D D D D D D 0 000 DD D D 0 D 0 םםםםםםהההתצ האנ‎ 
םםםםםםםםש 000000 םםםםםםםםםםםם‎ TRD D 00 DD 0 U 
0000 EU D D D D D GD OOO000000000000000000000 TS 
በገ በበ በበበ TSQOOO00000000000000000000000 
OOO00000000000000000 task struct 0 D] D D በ፲ 
OO0O000T7S0000000000000000000000000000000 
OOO000000000000000000000880 መጩበበበበ0[0000[0 TS 
U D D Dn D 00000000000 A0000 GUD D UD ה‎ 
OOO TRD DOO T" DD 000 DDD DD D D 0 00 D D םםםםםםםהאע‎ 
በ]መበበ]ጩበገመጩጠ[በበበበ TSD DDD 0 D 0000 D TRD 00000 DD 0 U 
በ መበ SON הפ‎ D D 0 0 00 DD D TRD 0 000 Tn DD D D D D 0 0 五 mux 
OOO00TSQ000000000000000000000000000000000 
OOO00000000 90000 GOD OO DDD TSS] 











































































































542 OOOO 


000000 schdle()0 D በ D sw tch to] 0 D 0 DD 0 D D D 0 0 D 0 D D 0 U 
000000 include/ 1 386/ system [ 


1  *define switch to] prev, next, last] do + \ 
asmvol ati l ፲፪] "push 56651 "+\ת‎ \ 
3 "push edi \ "+\ת‎ \ 
4 "push ebp nt" \ 
5 "novi 58655 Mint" /* save ESP */ \ 
6 "ml 56 #6sp\nt" /* restore ESP */ \ 
7 "novl $1f, nt" /* save HP */ \ 
8 "push Ant" /* restore HP */ \ 
9 "inp swtchtan" \ 
10 "1:\t" \ 
11 "popl ebat" \ 


12 "pod 99661 \ "+\ת‎ \ 
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13 "pod %esi\n\t" \ 

14 : "= [] prev- thread. esp] , "=ni [] prev->thread.eip], ላ 

15 "=b" በ1610 ላ 
m 
a' 
b 














16 O next- “thread. esp] , "ni 0 next- “thread. ei pl] , À 
17 " [prex], "d" [] next[], ላ 


18 " D prev D; \ 


19 } wile በ 0] 
swtch to םסםםםםםםםםםםםטםםםםםםםםםםםםהםםםםהםהםםהה‎ 
000000000000000 

e thread[] 1 [1 J U U [| thread struct [| D Ú 

3000000000000000000 3000000000000 םםםםם e‏ 
םםםםםםם 

0] D prev- “thread. esp[] [| 0 1] 0 prev- “thread. ei p[1 (1 0 D 0 D 0 D D D D D DU 
OOO 20 0 ex0000000000 Last DD U בםםהה‎ 

e םםםםם‎ 50000000000 

3] D next- “thread. esp] [| [] ብ] | next->threadeipQ (1 0 D 0 D 0 D D D D D 0 
000 300) 0 A000 ead el] ex0 DD DD በ በ prev] next በ | prev] 3 
D00000000 30000000 5100000000000 

e 0 20400000000 prev 000000 esil ed D epp] D  U LU U 0 

s ם‎ 500 prev U 1 1 1 1 D ebpO በ prev->thread ጩጩ[ [] 

e 0 600000000 œx 000000 next->thread esp[] ] epI D D Ú M 
םםםםםםםם‎ net DD DD DDD 0 00 D 00 00 0 DDD וא‎ 2 
OO000000000000000000000000000000000000000 
םםםםהה הש םםםםםםםםםםםםםםםםםםםםםם‎ nex በ 
task struct D DD D D 0 0 0 0 D 0 D 00 DD DD DD 0 0 D 0 D 0000 DDD D 0 
OO0000000000000000000000000000000 





























በ] 1 O0/0000000000000000 
0000 000 O000 000 O000 
og prev- >thread. esp 
U D 0 0 10 prev- thread. ei p 
2] ebx last 
3] next- “thread. esp 
ብ] next - “thread. ei p 
U 0 0 0 2] eax prev 
ፀ] edx next 
70 ebx prev 














« יםםםםלם‎ 000000000000 pa DD DD 400000000 
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OU prev->threadeipQ [111110 םםם"םםיםםםםםםםםםהההםהאא‎ 
e |] 8[] [| next->thread ip] | next JO 1 ה‎ [| [| U Ú next->thread ip] ND 
0000000000000 rxt 0000000000 700000000000 NG 
pp OO 000000000000000 0000000 70000000000000 
000000000000000 0000000000 40000 
s ] 9000 ገጩመበበበበበበ፲ call 00 DD DD DD 0. swtch 10()በ1 D D Ú 
בםםםםםםםםםםםם‎ UD D D swtch 1ዐ()በ በ |] ret DDD DD DD D 0 D D 
next->thread 697 D D D D DD DDD D D DD" 1 0000 
s 0 110 13000 መ 0 D 0 0 0 D 0 0 00 0 0 D D 0 0 0 D 0 D nest D 0 D D 
U D 0 0 00 D 00000 U 
0000000 םסא‎ 


(DU. swtch 0 በ በ] D በ በ በ በ [በ በ fastcall : 
extern void FASICAII[] switch to] struct task struct *prev, struct task struct *next] [] ; 


fastcdl QO D D D D D D DD 0 D D D 0 הנושה‎ swteh t00 DU D በ በ 5.10 
በበ]በበገበበ ገበ በበ ገበ DDD D 0 DDD 0 D D D DD D D eax] ek] prev] 
next םה‎ [] D [| swtch toOT [| Ú 




































































void switch to] struct task struct “prev p, struct task struct “next pi] 


1 
struct thread struct *prev = rev p--thread, 
*next = &next p “thread: 
struct tss struct “tss = 1111. tss + snp processor id): 


unlazy የመጩ] prev סיםםםםםםםםםםםםםםםםםםב*ה:ה‎ 


/* הפ ם‎ D DDD D 00 በ ከ በ 000 next->esp0] OOO nex D D UU LU 
በበበ በፆኖ 


tss- >esp0 = next- esp; 


OO OO fs) gs0 0 00 DO መበ ds0000000000000 
U U D 00000 


asmvol ati I ef] "novl 5845, 59": "₪ [] *[ int *] Sprev->fs [] ; 
asmvol ati I ef] "novl 58685, 59": "ari [] “Tint *] Sprev- >gs[] [ ; 


OOOO net DDD fs] gs00 


loadsegnent[] fs, next--fs[]; 
loadsegnent[] gs, next- >gs[] ; 


OO OO መጩበበበበበበበበበበበበበበበ 07000000 600000000 4500 
000000 OÙ 


if [] next- >debugred 7][] + 
loaddebug[] next, OQ; 
loaddebug[] next, 1[]; 
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loaddebug] next, 2]; 
loaddebug] next, 3]; 
/* no 4 and 5 */ 

I oaddebug next, 6]: 
I oaddebug[] next, 7] ; 








} 


if [ prev-- ioperm|| next-> operm í 
if [] next- 3 opermå í 


በበበ net 0 0 0 םםםםםםהםהנסע‎ 199 OO 
nencpy[] tss-0 bitnap, next--io bi tnap, 
IO HA እቁብ” SI ZF*si zeof[] unsi gned long] [| ; 


/ፆቾ D io bitnap[] ts] HH] 0000 tss- -bitnap [] [] 
tss- >bi tnap = IO H TMP CFFSET; 
} else 


0000000 2 


םםםםםםם 
sys iopernt) 000‏ 0000000 


tss- >bitnap = INAU D IO H'IMP CFESET: 


םםםםםםםםםםםםםםםםםםםםם הא םםםםםםםםהםםםםם 
በ1080 Eng] NONONO NDN DD DOON NONONO‏ 
በገ በ U D 00 0 0000000 00 0 U D U‏ 
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HOU 11:81 D 0 D 


U U U U D U D በ0 D 0 0 00000000 0 0 D U D U 0 U D U 0 0 0 U 00 0 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 [ 
U U DU 0 0 0 0 0 U በበበ በበበ 0 0 UU 0 0 0 0 U 0 0 0 0 0 0 0 0 U D 0 0 U D U 
DOON DD DD 0 D 0 0 0፲ cacha ON D 0 D D DDD 0 0 000 DD 0 U 
U D D 0 00 RAND NO D 0 D 0 0000 DDD 00000 DDD DUDU 61000000 
በገ] [በ 1 በ0 DU 00000000 U 00 U 


ד ההשו Ec‏ 
























































中 央 处 理 单元 
功能 单元 
œ 
ta | 寄存 器 
小 
内 部 cache 
外 部 cache 
便宜 
大 
磁盘 
ם‎ 61 00000000 





H mns D םםםםםםש םםםםםםםםםםםםםםםםםםםםםהםההנה‎ 
OOO0000000000000000000000000000 Intel 38600000 
በበበ DU D D D 0 0 0 0 D D D 0 0 DU 0 0 0 0 DU 0 0 0 0 0 0 0 0 0 D D םהש‎ 
U U U UD U U D 0 0 0 በበበ 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U U U U D 0 0 0 በበን 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 





61 Ume D 0 0 0 0 [ 


limx J0000000000000000000000000000000000 
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OO000000000000000000000000 בםםםםםםםםםהםההאם‎ 
U U 0 U D 0 0000000000 0 D U 0 DD U D U 0 U 0 U 
U D D DD 0 Intel 386 000000000 Hn Q0000000000000 
U D D DDD Hn 2.00 D 0 D 0 000 D D D D 0 Ixme 0000000000000 
00 Ape] [ በ DEC Apha[] [| D MPS] Mtorola 66k] D D 0 0 O00000000 
U D D DDD 00 DDD DD Intel ו‎ 0 D 0000 DDD 0000 U 
DH nme D D U 0 0 በ D 0 በበበ በ 0 Lin DD 0000 U 
U U 0 0000 U 
e U UU UU U 

- U UU U U 

- 00000 

« 000000000 

e 0000000 

U U U U D U 0 0 0 U D 0 0 00000 U 



















































































611 האתם‎ 00000000 
םבםםםםםםםםםם‎ llim NOD DD 000 DD 62000 


swap 





062 Inzx000000000 


OO 620000000000 በበበበበበ ሀበ OOO 
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በበ D D D D D (mani DDD DD D D D 0 0 D 00 DD D D 0000 U 
U U 0 U D 000 U 
02000000 sapi DD D 0 D 0 D 0 0 0 0 D 0 0 0 0 0 0 0 00 U 
U U 0 D 0 0 0 RAM D D D 0 D 0 0 0 םםםםםםםםםםםםםםםםםםםםםם‎ 




















= 
= 
= 


E 
= 
= 


U 230 D D 00 D 000 D core D 0 D 0 0 0 D 0 0 D D 00 DDD DD DD 00 U 
U U U U U U D 0 0 0 0 U 00000 000 U DU 0 U D U [ሀ U U 
H4000000000000000000000000000000000000 
U U 0 MOOO D D DD D 0 D 0 0 0 NDN 0 D D D 0 D 0 0 0 0 D 00 000 U 
U U U [በ 0 U D U 0 0 000000 U 



































612 000000000 


U U 0 0 0 0 0 D 0 Dms 0 D D 0 0 0 0 0 0 0 00 D 0 00 0 0 D 0 D 00 00 0 U 
Dot 00000000 0 46000 meg D D D d4G0 DD DD 0 D 0000 D 0 U 
በ 1G0 D በ 00000 0000000000 (PED 0 D D D D D 0 D": 0 0 0 0 "DD U 
000 360000000 0 0000000000 ጨዌ8ጡመሟጧበበ1000[00000”በ0[ቨ 
U "00 D D D D 0 0 0 0 D D I 0 H ne 0 0 00 0 0 DD 000 0 0 U 
םםםםםםםםםםםםםםםםםםםםםם‎ 46000000000 6300000 
U U 0 0000 U 


0000000 1680 


0010 
U D 0 U 
(3GB) 





0 000000 אתתם 063 


H mns 0 0000 DDD DUD 00000030 0000000000 63000000 
OO000000000000008360000000000000000000000 
በ IG0000000000000000000000 


םםםםםםםםםםםםםםת 


U U U U D U D 0 0 0 D 0 0 0 00 DU U D U 0 U DU 0 0 0000 0 D 0 0 DU U 
U U U UD U U D 0 0 0 በበ 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
O0O000000000000000000 

IGQO0000000000000000‏ םםםםםםםםםםםםםםםםםםם 
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በ D O ዐ000000010000በ0 64000000000000000000000000 
በ goxmoooooogd OOOOOOOOOOOOOOOOOM H ne [0 ሀሀ D PAE GRE 


4G 
0 0 


000000 00000 
םםםםםםםםםםםםםםםםםםה 064 


U D D D D D D inelude/asnfi 386/ page. hD D D 000000000000000 
/* 

* This handles the nenory nap.. Vé could nake this a config 

* option, but too nany people screwit up, and too fewneed 

ቾ it. 

x 

* A PACE CFFSET of 0x00000000 neans that the kernel has 

* a virtual address space of one gigabyte, which limits the 

* anount of physical nenory you can use to about 950MB 

x 





























* If you want nore physical nenory than this then see the CNI G HGMMG 
* and QNI G HGHMEMMG options in the kernel confi gurati on. 
*/ 


#define | PACE CFFSET [| 08(000000001] 

Hef ine PACE CFFSE U U unsigned long] PAE ŒFSEI 

#define pal] x] 0 [] unsigned long] [] x] -PAGE ŒFSET] 

Hdefine val] 31] U ם‎ void 4] 0 O unsigned long] [] x] #PACE ŒFSET] [] 


9m OOOOOOOOOOOO‏ בםםםםםםםםםםםםםםםםםםם 
GNIGHGMMG] GNIGHGMMAG] D DD 0 D D D D D 0 D 0 0 D 0 0 0 0 D 0 U‏ 
950M] D 0000000000000000 0000000" x PAE CFSET' OD‏ 
xt PAE CESET)‏ "000000 םםםםםם 

በበ[[በ[በ09 eOG00000000000000000000000000 
በገ [በ U D 00 0 000000000 U 
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200000 











U U U 
0000 G000000000000 PAD D D DDD 0000 DDD D 0 0 
0 םםםםםהםםםםםםםםםההטם‎ mD D D በ D በ በበ nmcontext.ho D D D] 


OOOOOO 
asmvol 811] ፲ሸ] “ שם‎ 90, %er3” : :" r” [ pag next- ægd] O ; 


OO0000000000000000000000000000 nex pgd OO 
םםםםםםםםםםםםםםםםםםםםה0א‎ mD D DD 00 oD DDD 0 0 
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U D D 00000 D 3000000 next D I I 0 0 PONDO 


םםםםםםםםםםםם 613 


Dm J0000000000000000000000000000000000 
U U U U U U D U 0 U D 0 000000 U 


[ 



























































D Kernel Inage OO‏ םםםםםםםםםםםםםםםםםםםםםםםם 
U D D Dnes D 00000000000 0001000000 000000 IMO D 0 በ‏ 
0000000000000000000000 םםםםםםםםםםםנםםםם 
PE GFSEM D D D D D 0 0‏ םםםםםםםםםםםםםםהםםםםם 
go 0001000000]‏ םםםםםםםם 
פםםםםםםםםםםטםםםםםםםםםםםםהםםהשאא םםםםםם 






































065 000000000000 


U U D 0 D D D 0 D 
0000000 
00000000 
HU uut 
U uut 
0000000 
በበበበ በበ በበ 65000 
内 存 的 分 配 和 回收 +, | 
57 ጩ| 9 
፳፪ 
T | a 
地 址 影射 缓存 和 刷新 [e (Fm 
(7) 








U uu 
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O0O000000000000000000000000000000000 
OOO00000000000000000000000000000000000 
O0O00000000000000000000000000000000000 
O0O000000000000000000000000000000000000 
םםםםםםםםםםהותאעת םםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U UD U U D 0 0 0 D 0 0 0 0000000 00 0 U DU 0 U D U 0 U 0 U D 0 U 
U U U UU U 000 U 







































































62 mx 00 DU 0 0 0 l 





= ET. E Ed = El 


ET EEE ETER 





በበበበበ በበ MW 0 0 D 0 0 D 0 0 D D D 0 0 D 0 MD 0 0 0 0 0 D 0 0 0 0 U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
O0O0000000000000000000000000000000000000 


U U U U 0 U D 000 U 


6.2.1 000000 


በ Hn 0 000000 0 000000 0000000000000 DD 0000 U 
U U 0 D U 0 0 0 0 0 D DU 6nsQQ00000000000000000000000 


DH ns H 00 0 በ በ በ 0 0 /archi 386/ kernel / head. ST በ startup 321] 


םםםםםםםםת 

/* 
* The page tables are initialized to only 8MB here - the final page 
* tables are set up later depending on nenory size. 


/* 
* enpty zero page nust inmediately followthe page tables ! [] The 
* initialization loop counts until enpty zero page] 
*/ 
. org 0x4000 
FNRY empty zero pagel] 
Ü * 


* Initialize page tables 
*/ 
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nov! $pg0- PACE ŒFSET %di /* initialize page tables */ 


novl $007, Yeax 


2: 81081 


/* "007" doesn't nean wth right to kill, but 
PRESENHRWLSER */ 


add $0x1000, %ax 
cnp $enpty zero page PACE CFFSET, %di 





jne 2b 














2240000000000 


10 20 3000000 200000 8BO0000000000000Uimx000 
U D D D D D 0 BM) D D D D 0 D 0 emty zero page D (DD 0 70 D 0 0 0 0 DU 





በገ U D U D 0 0 U D 0 0 0 0 000 U DU 0 U D U 00 0 000000 U 
0 BPD D 0000000000 DD መሀበበበበዐበሀበበበበበመዐበበ[በ;በ 
000000000000 0 0" $pg0 PAE GFSET ” הבה‎ po 0 D D D D D U 
בםםםםםםםםםםםהם‎ 020000 00.00000 0O 0x0010200010 pat UU 
OO Ox00103000] POD pi D 0 0 0 D D D D D D 0 0 0 D D 0 0x07]0x1007] 
0000000 3000 100000000 DDD 00000 DD DD 0000 U 





OOOO 0፡0] 01000] Ox20000 DD 0000000 


U U 0 U D 00 በበበ በሀበ D U 8 


2000000 
[* 


* This is initialized to create an identity-nappi ng at © 8እብ] for bootup 
* purposes] and another napping of the 0-8Marea at virtual address 


* PACE CFESET. 
* 
. org 081000 
ENRY] swapper pg dir] 


. long 0x00102007 

. 1 ong 0800103007 

fill BO USER KD PIRS 2, 4, 0 
/* default: 766 entries */ 

. long 0800102007 

. long 0x00103007 

/* default: 254 entries */ 
.fill BOOT KERNEL PO PIRS 2, 0 


/* 


* Enable paging 
*/ 
3 


novl $svapper pg dir- PAGE CFFSEL %ax 


nov! Yeax, 3 
novl %r0, Yeax 


/* set the page table pointer.. */ 


orl $0x80000000, Yeax 


nov! ax, 560 
jnp if 


novl $1f, Yeax 


/* . . 800 set paging | PG] bit */ 
/* flush the prefetch queue */ 





L1 C0] 
[ተ] 
O 0 


Ea 
RE 
= ሀ3 
-] 


[ 














ሀ3 ር መ= G 
ooo 
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j mp *Yeax /* make sure eip is relocated */ 


swapper pg dr NODOODO‏ בםםםםםםםםםםםםםםםםםםםםםם 
ra) DD c00 000000 DDD 0000000‏ בםםםם 
box 00000 DD 00000 DD 000 0 U‏ בםםםםםםםםםםםםםם 
00000000000000 אפנעםםםםםםםםםםםםםםםההלאט OO‏ 
U D DU D 00 D DDD 000 DD DD DD 0 0 0 DD በ Intel i3600000‏ 
U D UD D D D D 00000 D BED 00 D D D D 0 0 D DD ev jan DDD 20‏ 
BPOOOO‏ םםםםםםםטםםםםםםםםםםםהםםהםה*א 100000 0 
2 םםםםםםםםםםםםםםםםםםםםםםםםםםםםם ההא በበ‏ 
PAGE ŒSEM 0 D D 0 1 nm D D D D 0 HP‏ 0 0 10000000000000 0 
GUD D 0 0 0 D 0 0 D 00000 D 000 0 U‏ םםםםםםםםםםםםםםםםםם 
U U U U 0 U D U‏ 
U D D D D 0 0 svapper pg dir DD DD D D 0 D 0 D D D D D 0 መሀ pl d D D‏ 
U D D 0 D 000 ቨ በ DU (6001020001 0001090000. 2.220 000000000 2‏ 
D DD DDD 000 DDD D D D svapper pg dir OG 000 10000 (0001020071‏ 
DU p90 pøj D D D D D D 0 0 0 0 D 0 D D 0 D 000 DD 0 U‏ ]0800103007 
Od 2] 7670 7600000000 00 D 00000 U‏ ה*א OOOO svapper pg‏ 
]4 1024000000000000 400000000000 400000 000 
OOO 780000000000000 768x1024x4K] 3G] 0 0 swapper_pg dir 0 U‏ 
780000000000000 ם 
םםםםםםםםםםםםםםהםו መሀ‏ 7900000000 ]7681 00000 
UD 2560 D 0 0 0 0 D D D D D ቨ 0 0 d 256x1024x4 1G]‏ 2400000 10230 ]770 
OOO svapper pg dir] DOON 260000000000000‏ 
D D 0000 DDD DDD DD svapper pg dr DD DDD DDD 0000 DDD U‏ 
U D D 00000 DD 8B0000000000000000 66000‏ 





U U 
U U 
U U 
U U 





















































1023 0 











0 43 
769 | 7 2 
769 | 7 Séi 




















E aa og 
0x00103007 | PE 
Ox00102007 ו‎ d 

RE OL Hh. Hk E [8] 








፦ 


























a 





























swapper_pe dr‏ לד 


בל 
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swper pg år JO 00‏ 00000 66 ם 


OO00000000000000000000000000000000008M0 




















O0O000000000000000000000000 
00000 svapper pg dr DD 000 DD D D D D 0 0 0 D 0 DD 0 0 000 DD DUH 
בםםםםםםם‎ GUD QO0000000000000000000000000000 
U D D 0 00 EY O000000000000000000000000000000 
U U U U DU U 


D000000000 


00000000000000000000000000000000000 670 
U U 











































































































empty zero page 
Ox 00104000 
0x00103000 


Ox001 02000 
0200101000 


pel 
peo 


swapper pg dr 











Ox001 00000 








በ67 DO0O0000000000000000000 


OU empty zero መሯበ|[በበበበበበበበበበበበበገበበበበበበበበበ[በ[ 
በበበ መጠበበበበበበበሀሀበበበ ONO OT 00 "UD 0 0 D D D D D D FONE 
U D DD 0 0 D DD 00 DD DD D D D D 0 0 D D D D D D D 0 D 0 D 0 D D 00 0 0 U 
U D DD 0 0 D DD 00 DD DD D D D D 0 D D D D D D D D 0 D 0 D 0 D D 00 0 0 U 
በበበበበበበ DD "0 0 הפש‎ D DDD D 0 D 0 0 D 0 U 

/* 

* This is set up by the setup routine at boot-tine 

*/ 

#define PARAM [| D unsigned char *[] enpty zero pagel] 
#defi ne SCREENINO | *] struct screen info *[] [] PARAM] [] 
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#define EXT MMK [] *[] unsigned short ግ] [ PARAM20 [] 

#define ALT MMK [] *[] unsi gned long *] [ PARAMOXle [] 

#defi ne F820 MP NR[]*[] char* [| PARAMEB20NQ] O 

#define E820 MP [] [| struct e820entry *] [] PARAME320MP] [] 

#define APMH C5 INO] *[] struct apmbios info *] [] PARAM0x40] [] 
#define IR VE INO] *[] struct drive info struct *] [| PARAMOx80[] [] 
#define SYS DESC TARIE [] *] struct sys desc table struct*[] [] PARAMOxa0] [] 
#define MINT ROY RAINY |] *] unsi gned short ግ] [| PARAMOx1F20 [] 

#define RAMI SK FLAGS [] *[] unsigned short *[] [] PARAMOx1F8 | [| 

#define CRG ROT TEV [] *] unsigned short *0 [] PARAMOX1RT] D 

#define AX DEM CE INO [] *[] unsi gned char *{] [| PARAMOx1FH] [] 

#defi ne LOADER TYPE [] *[] unsi gned char *[] [| PARAM0x2100 [] 

#define KERNEL START [] *[] unsigned long ሣግ] [| PARAMOx214] [| 

#defi ne IN TRO START 0 a) unsigned long 4] 0 PARAMOx218] በ 

#define IN TRD SIZE [] *[] unsigned long *] [| PARAMOx21q[] [] 

#defi ne OMN IINE በ D char *0 [] PARAM2048] [] 

#defi ne CMAN LINE SIZE 256 


000 PARAM] [| empty zero page] D D D 0 0 D 0 D D D 0 0 0 0 0 0 0 0 0 0 U 
בםם םםםםםםםםםםהם‎ B20 השא‎ [ 0 D C] ፻፻መሠ0 እበ [| struct e820entry [] O 
U DDD DD DD DD DD 000 0 20 00 D D D D D D D D D D U 


incl ude/ i 386/ e820. h[] [] 
struct e820nap { 























int nr_nap; 

struct e820entry { 
unsi gned 1 ong 1 ong addr; /* start of nenory segnent */ 
unsi 0060 1 ong 1 ong size; /* size of nenory segnent */ 
unsi gned | ong type; /* type of nenory segnent */ 

y napl E820M 


extern struct e820nap e820; 

በ [| በ B20MKO 000 327 D D D D D 0 0 0 D 0 D D በ በ በ በ በ e820entry 0 D በ 
U U DU D D D U U D D D 0 D U U 0 D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 D 0 0 0 D 0 D D U 
U U D 0 0 D 0 በ bañ D D D D 0 0 RM D 0 D 0 0 D D D 0 D 0 0 NG RAM D [ [| U 
OOOO0000000000000000000 e820.h0 00000 40000000 


#defi ne F820 RAM 1 
#define E820 RESERVED 2 
#define F820 API 3 /* usable as RAMonce ACPI tables have been read */ 
#defi ne F820 NS 4 


#defi ne HGH MMR [] 1024*1024r] 

QO B320 הפא‎ DO“ Non Vol ati le Storage” 0“ 111” 000000 RN EPERONMI 
Hash[(] D D 0 D 

0 PONDO 1MR[ D D D D D D UO D D D በ በ በ 60K8] Ox0-Ox9FFFK] [] RAM 
በ באס‎ 000000 GY BA] WGT D D DD D 0 0 0 D 000000000 0 
םםםםםםםםםםםםםםםםםהם‎ BAD WD D II D 00000] D [] OxFFFFH| O 
OOO 4000 PRM] Hash 0 D 0 0 BOT D D 00 00 HOSD DDD U LU LI D 
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U D D DDD x םםםםםםםםהשא 0000000000 20 ההש‎ ፻ሎብ] D n 
םםםםםםםםםםםהההאםםםםםםםםםםםםםםםםםםםםםםםם‎ 
00000 האנה *"םםםםםםהראג‎ D D D D D D D D D D 0 0 0 0 D D U 
በ በ በ AGIMMR[] D D D “ 1024x1024" 0000000 הא‎ D D 0 0 D D D aD 
םנה םםםםםםםםםםםםםםםם‎ 
OOO00000000000000000000068000 
































end 


未 初始 化 的 内 核 数据 
רה‎ 


已 初始 化 的 内 核 数据 
_ etext 





内 核 代码 
0x00100000 _text 











םםםםםםםםםםםםם 068 


OO הי‎ 0 D D D ፀጩበርዐር በበበበበበበበበበበበበበበበ[ሀበበበ[;ቨበ 
OOOO0O000000000 etet 0 DUDU DD 0 U D U 0 U DU U D 0 0 0 D U 0 0 U 
OOO000000000000 ger DD D DU edat aù NN DD D 0 0 00000 DUH 
םםםםםםםם‎ ed D 0 0 0 DD DD DD 000 0 U 
בםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ SystemnpQ t 0 Ú D 
00000000000000 D D SstemepJ[00000000000 











622 0000000 


በበበበ]በመመበበበሀበበበበበበበበበበበሀበበበበበበበበ[በ[ሀ[ሀሀበበበ 
O000000000000000000000000000000 שםםםםםהא‎ 
םבםםםםםםםםםםםםםםםםם‎ BONO” int 0x15" םםםםםםה‎ Lima D D 
ሽገገበበበበበበበሀሀመበሀበሀሀበበበበበበበበሀበበበበ[ 
DU D DDD DD UD e8200 000000000000000000000000000 
U D DDD DD 000000 e8200 0000000” in 015 00000000000 
U D DD [ [ Oxe820] 

OO000000000000000000000 init/nainc D start kernel 
00000 start 78 000000000 setup arch() [ በ O setup arch] OOO 
arch/ i 386/ kernel / setup. c D D D 00 0 0 D 0 D 0 0 D 0 DD 0 D 0 0 D 0 D 0000 D 


= 
= 
ጩ 
5 
o 
r3 
= 
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U U 
19 setup arch()[] [| 


U D DDD 000 DDD DU D 0 0 0 setup arch} DD D D D D 0 0 0 0 0 D D 0 U 
0000 setup menory regi on) D 0 0 D D D D D D 0 D 0 B 0ጩመ].00000 
הא בםםםםםםםםםם‎ DDD DD 000 DD D D 0 0 0 

OO parse nemcnaline(cndline ה‎ D D D D D D D D D D D D 0 0 D 0 0 D 0 0 





























RMC 0 D D 0 D 0 D 0 D 0 0 0 0 0 0 0 D 0000 DD 0000000000 000 U 
OO00000000000000000000000000000000000 e820 
U U 0 U D 0 0 0 0 00 setup. ci O 

U U U U 


#lefi ne PEN U xl OOOx0 + PÆE SIZE IT > PAGE SHFID 
#define PEN DOW] xf] 00X] > PAC SHFT] 
tidefi ne PEN PHY] xX] Dx] > PAX SHFT] 
PEN הת‎ 0 NON םםםםהה‎ > 0 [ D D D [ [በ PN Page Frane Nnber 
በበበ D D 0 D 0000 PNU 0 0 DDD x00 1000000 PEN DONI OO 
OOO x00 1000000 PNPASI D 0 D 0 DD םםםםםבא‎ 


U U U 
/* 
* 128MB for vnalloc and initrd 
Så 
#defi ne VMLLOC RESERVE [] unsigned long] [| 128 << 20] 
#defi ne MXMEM[] unsi gned 1 ong] [] - PAGE ŒFSET- WALLCC RESERVE] 
#defi ne MXMEMPEN PEN DOWN] MXMNIJ 
#define MX NOPAE PFN] 1 > 20] 


U U U U D U 0 U D U 

° WéI RESERVA vallod DD D 0 D D 0 D D D D 0 0 0 D D 00 UU [אאע‎ 

. אאא‎ D D D D D 0 D 0 RAM II [ 168] 128M] 896M] - PACE CFFSET 
U D D 11 

* אאא‎ D D D D 0 0 0 0 0 D D 0 D D 0 0 0 ሀ 

. MX NMAÆ PN D D D 48000 100000000000000 EAR) D D 
םםםםםםם‎ 46000000 

U U 0 U 0 U 00000000 U 

/* 


* partially used pages are not usable - thus 
* ve are rounding upwards: 
*/ 
start pin = PFN UJ pal] Send] [| ; 
םםםםםםםםם‎ m DD DD DDD DDD DDD D 0 D D D D D end tl 
בםםםםםםםםםםםםםםםםםםםםם‎ start בםםםםםםםםםםםםההפ‎ 
U D D 0 U 


U U U U 0 U D 000 U 
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/* 
* Find the highest page frane mmber ve have available 
*/ 
max pfn = 0; 
for i =0 i «e820.nr nap 140 + 
unsi gned long start, end; 
/* RAM */ 
if J 6820. nap[ i ]. Lype ! = F820 RAM 
conti nue; 
start = PEN LF] e820. nap[ i]. addr] ; 
end = PEN DOM] 6820. nap[ i]. addr + e820. nap[ i]. size[] ; 
if [ start = end] 
conti nue; 
if [] end > nax pfn] 
nax pfn = end; 
} 


0000000000000 E20 בהא‎ RAM 0 0 0 0 D 0 D D DD 0000 U 
00000 nax_pfng [ 
U U U U D U D 0 000 U 


/* 
* Deternine 1 owand hi gh nenory ranges: 
#[ 
nax lowpfn = nax pfn, 
if D nax lowpfn > MXMMPEN] 1 
nax lowpfn = MXMEM PEN 
#fndef CMI G H GMM 
/* Mxi mmnenory usable is what is directly addressable */ 
pri nt k] KERN WRN NG "Vérni ng only %dMB wll be used.\n", 
MXMM520] ; 
if D nax pfn > MX NOPAE PFN] 
pri ntk] KERN WARN NG "Ube a PAE enabl ed kernel .An"[] ; 
else 
pri nt kf] KERN WARN NG "156 a H@MMenabl ed kernel .\n"[] ; 
Helse /* ! CNIG HGMM*/ 
#fndef CONG X86 PAE 
if D max pin > MX NONPAE PEN] + 
nax pfn = MX NONPAE PEN 
pri ntk] KERN WRN NG "Wrni ng only 4B wll be used. 1n"[] ; 
pri nt k] KERN WARNING "156 a PAE enabled kernel .An"[] ; 
} 
#endif /* ! CONFIG 386 PAE */ 
#endif /* !GONIG H GNEM*/ 
T 


U uuu 


U D D D በ በ RAM] [| 86MT TO 480 00 @NIGHGMM|] [100000 
U D D D D 0 RD D 4] D D D በጃ. 386 PAH] [0 הש‎ D D D 0 0 0 0 ከ 


O0O000000000000000000000000 


#fdef ONIGHGMM 
hi ghstart_pfn = hi ghend pfn = nax pfn; 
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if D mx pin > MXMMPEN] 4 
highstart_pfn = MXMM PEN 
pri ntk] KERN NI CE "%dNB HGMMavai I abl e. n", 
pages to nål] highend pfn - highstart ፲1ቭ] [] ; 


























} 
#endi f 


00000 CNG H MAD D D D D D D D D 0 0 0 D D D D esevwn 00000 


U U DU U 


בםםםםםםםםםם 
Initialize the boot-tine allocator [] wth lownenory only] :‏ * 
KEE —init bootnem] start pfn nax low pfn] ;‏ 
OOOO init bootne [000000000000000000000000‏ 
stat po] 0000000000‏ בםםםםםםםםםםםםםםםםםםםםםם 
በበበበበ edQ000000000000000000000000000000‏ 
D 0 D D DD [ max 1፡9 D 000000000000 O] mx lowpfng 1‏ 
U DU 0 0 0 D 00000 DD hol eiiD D 0 DDD 0 DD 00 D 0 0 0 D 0000 0‏ 
U D D D 0 0 D DD 00 DD DD D D D D D 0 D D DD D D D 0 D 0 D 0 0 D 00 U‏ 
bootnemi] OOO‏ ][ 
U bootnem[] 0000000000 O] 86% 000 RAM] lj‏ 
*/ 







































































* Register fully avail able low RAMpages wth the 
* boot nem al I ocat or. 
TÅ 
for i =0 i «e820.nr nap iH + 

unsi gned long curr_pfn, last_pfn, size; 
/* 
* Reserve usable | ow nenory 
*/ 
if [] 6820. napli ]. type ! = F820 RAM] 

conti nue; 
/* 
* Vé are rounding up the start address of usable nenory: 
*/ 

curr pfn = PFN UT] e820. nap[ i ]. add] ; 

if D curr pfn >= max low pf n] 

conti nue; 

/* 
* ... and at the end of the usable range downvards: 
*/ 
last pfn = PEN DOM] 6820. nap[ i]. addr + 6620. man i [ si ze] ; 

if D last pfn > nax low pfn] 

last pfn = nax lowpfn; 

/* 
* .. finally, did all the rounding and playing 
* around j ust nake the area go away? 
*/ 

if D last pfn <= curr Gr 


— 160 - 





EEE ET A בת‎ 












































[ Linux | 








conti nue; 
size —last pfn - curr pfn; 


free bootnenl] PEN PHYS] curr pfn] , PEN PHYS] size] H ; 


} 

0000000000000000 RM [| OO free oot nmm) 000000 FAM] 
በበበ ገገ በበበበበበበበበበበበበሀ Hog Rh DDD 0000 DD 0 0 D 0 0 0 
םםםםםםםםםםם‎ 

U U U U U 

/* 

* Reserve the bootnembi tnap itself as well. V6 do this in two 

* steps [] first step vas init _bootnenf] [| ]| because this catches 

* the [] very likely] case of us accidentally initializing the 

* bootnemallocator wth an invalid RAMarea. 

*/ 

reserve boot nen] HGIMMRY, [| PFN PHYS] start | + 
bootnap size + PACE SIZE 11] - 0 HGIMMRY [] ; 


U D D D በበ D D bootrem 11111111[01]"በ] D ዐ HGIMMNHY[] IM] 
U U U U D 0 0 DU 0 U UD 0 0 D U 0 U UD 0 0 D 0 በ 
םםםםםםםם‎ 
paging inito D ; 
U U 0 U D 0 0 000 0 0 0 0 UD D 0 U DD 0 U UD D 0 UD U 0 U D 0 (U 


2] setup nenory region() [] [J 


ጃጀመበበበበበበበበበበበበበበበበ[በበበ[በበ e8200 00 0‏ םםםםםםםם 
በገ] በ U U D 0 0 0 D U 0 0 0000000 000 U D U 0 U U U‏ 

e DO sanitize e820 ה(‎ D DDD D D D 0 0 D DD DD 00000 DD BG 
U U U በ በ U D 0 0 0 D 000 U 

° UU copy e820 ה‎ D D D D 0 D D 

e I000000000000000000000000000000 AK] 1M] 
U U U U DU U 

e 0000000000 


3] copy 6820 nap() OO 


U D D D D U 
static int init sanitize e820 nap] struct e820entry * biosnap, char * pnr nag] 
בםםםםםםםםםם‎ 


0100000000000 2000000000 BGOOO םםםםםםםההאא‎ 
if [ nr map >2[ 
return -1; 


O20 BOD D DD DD 000 
do + 











unsi 0060 l ong long start = bi osnap- addr, 
unsi 0060 1 ong long size = bi osnap- Xi ze; 
unsigned I ong long end = start + size; 
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unsi gned l ong type = bi osnap- “type, 
03000000 
/* Grerflowin 64 bits? Ignore the nenory nap. */ 
if [] start > end] 
return -1; 
0400 הבא‎ ር4,ቭ] [000000 םםםםםםםםםםהםהההתא‎ 
0xA0000 [10000000000000000000000000000000000 
KANO | D D D D D D እጀ | D DDD DDD DDD 00 D 0 0 0 D 00 በ በ 0x4000 


በ מםםםםםםםההאפ‎ 
J* 
* Sone H (865 claimRAMin the 6408 - 1Mregi on. 
* Nt right. Fixit up. 
*/ 
if type = B320 PAM í 
if [] start < Ox100000UL S&end > OxAOOOOULL] í 
if [| start > OxADOOOU1/] 
add nenory region] start, 0xA0000UI;start, type] 
if [] end = Ox100000UL[] 
conti nue; 
start = 0x100000U I; 
size =end - start; 


} 


add_nenory region] start, size, type]: 
} while [] biosnapH,--nr nap] ; 
return O, 


ብ] add nenory regi on) [|] [J 


በበበበበገ በ በ በበ e2000 000000000000000 
010000000 820J000000 
int א‎ = 6820. nr_nap; 
በሟበበበበበበበበበ ውግ በ በበበበበበበበበበ[;በ[;[ 
if [] x = F820M 1 
pri nt k] KERN FRR "ps! Too nany entries in 
the nenory nap!\n"] ; 
return; 


} 
0300 e2000000000 n nap] 10 
e820. nap] x]. addr = start; 
6820. nap[ x]. size = size; 
6820. nap[ x]. type = type; 
6820. nr nap++ 


ST print nenory nap() D [J 


OOO00000000000000000000000000000000000 
םםםםםםםםם‎ 8ጩቨ በ 0 ሀ በ በ MOO 
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BG e820: 
BG e820: 
BG e820: 
H G 6820: 


623 0000000 
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- 00000000000a0000 [] usabl ef] 
- 0000000000100000 [] reserved] 
- 000000000ር000000 [] usabl ef] 
- 0000000100000000 [] reserved] 


םםםםםםםהאם םםםםםםםםםםםםםםםםםםםםםםםםםםם 


U U U 


ID D D D D D 0 0 ወዳ|በበ[[ DDD በ በ NM 


םםםםםםםםםההשטשנםםםםםםםםםםםםםםםםםםםםםםםם 
በበበበ[0[0ሀ00008”ቨቨ ቨ ከ D D 0 Wi form Mnory‏ 
O00000000000000000 GUD D D 0 0 0‏ 















































U U U UU DU U 
Archi tect ure[T'[] [| 























בםםםםםםםםםםם 
Archi tecture] []‏ 
በበበበበበበበበበ AJ rm‏ 
U D D DDD D mw ANT 0 D B OT D 00 0 0 0 000 RAM D0 00 UMTL 000‏ 
በ RAD DD D DD OD 00000 U‏ 
MOO‏ 000000000000 
24000000 םםהאשעםםםםםםםםםםםםםםםהםםהה האא በበ‏ 
-- ההםהםהםםהםהםםהםהם በበበ NMAN በበ DDD 0 0 0 0 DD UD D 0 NAN‏ 
מםםםםםי"םםםםיםםםםםםםםםםםםםםםםםם"נםםם)םםםם" 
ROO 10000 500000‏ םםםםםםםםםםםםםםםםםםםםםםםםם 
3000000000000000000 םםםםםםםםםםםםםםםםםםםםם 
U D DD GU D D D DDD 0 50000000000000000000000000‏ 
በበበበ 5S0000000000000‏ 
mx 0 D [|‏ 
OO 3000000000000‏ 








L1 

























































































U U 
U U 
U U 
U U 
Un 


0 
U 
[] 
[] 
0 "מםםיםםםםםםםםםם‎ 
0 


0 
U 
[] 
[] 
[] 
ל‎ 
OO0000000000000 CO OO 0000 


በገ በበበ በበበ በበበ በሀበ በበ በበ 
OOOO WOOO 


























D D D D D UD D በ UU Ne 0 [T] Zona] D [T] Pagal] 


- 163 - 









































[| I Linux | ul 














20 D D 0 Page] U 0 0 0 


D በ O00 inc ude/1li nux/ nmh[] [‏ םם םםםםםם 

/* 
* Fach physical page in the systemhas a struct page associated wth 
* it to keep track of whatever it is we are using the page for at the 
* nonent. Note that ve have no wy to track which tasks are using 
* a page. 
* 


* Try to keep the nest conmonl y accessed fields in single cache lines 
* here [] 16 bytes or greater] . This ordering should be particularly 
* beneficial on 32-bit processors. 

* 

* The first line is data used in page cache lookup, the second line 

* is used for linear searches [] eg. clock al gorithmscans{] . 


x 


* TOQ make this structure snaller, it could be as snall as 32 bytes. 


"i 
typedef struct page 1 
struct list head list; /ች -»napping has sone page lists. */ 
struct address space *napping /* The inode [] or ...[] ve belong to. */ 
unsi gned 1 ong i ndex; /* Qr offset wthin napping. */ 
struct page *next hasly /* Next page sharing our hash bucket in 
the pagecache hash table. */ 
atomic_t count; /* Gage count, see below */ 
unsi gned 1 ong flags; /* atomic flags, sone possibly 
updated asynchronously */ 
struct list head Iru; /* Pageout list, eg. active list; 
protected by pagenap lru lock !! */ 
wait queue head t wit; /* Page locked? Stand inline... */ 
struct page **pprev hasly /* Gonplenent to *next hash. */ 
struct buffer head * buffers; /* Buffer naps us to a disk block */ 
voi d *vi rtual ; /* Kernel virtual address [] NIL if 
not knapped, ie. highnem] */ 
struct zone struct *zone; /* Mnory zone ve are in */ 
T nemnap t; 


extern nemnap t * nemnap] 


O0O00000000000000000000000000000000000 


O0O00000000000000000000 
OOO0O000000000000000 pagel man] 
אפוםםםםםםםםםםםםםם‎ JO0000000000000000000 

OOO0000000000000 inde D םםםםםםםםםםםםםםםםםםםהה‎ 


U D 0 D DD DDD 00 D D ₪ line] DD 00 D DD DDD 0 DDD 16 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ ሠ 
U U U 

U U D 0 0 0 0 D 0 0 0 D 0 0 Paged 0 remnap tf] D D D 0 0 0 0 0 DH 0 0 D U 


0 
U 
0 
U U DU 0 0 0 0 0 U D 0 0 U D U D 0 0 0 DU 0 0 D U 0 0 0 0 0 0 0 0 0 D 0 0 U D U 
[] 
[] 
U 
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Page] DOON መመጩ፣በበበበበበበበበበበበበበበበ[በ‏ בםםםםםםםם 
SI D DD Zone‏ 


3000 םםםםםםםםהאתתםםםםםםםםםםםםםםם 
M000 AN DAD D [ 0 1ጮኽ] ;‏ 00 ° 



















































































° 000 ZN NRMLO D D D 16M] 0 896MH] ; 

s 0000000000 האל‎ OOD 896M] 

DAD 0 000 DD D DD D D DAD 0 0 0 D 00 D ID OG‏ נבםםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U‏ 
OO000000000000000000000i368U)000000000000‏ 
OO መጠበበበበበበበበበበ EJ D D D D D 0 0 MUD D D D 0 D DAD D 0 0 U‏ 
በበበ MUD በ በ በበ በበ 0 D D 0 0 D 0 00 0 000 000 0000 0000 U‏ 
ההא 1SA90Q0O0000000000000000000000‏ םםםםםםםם 
U U 0 D DU00000000 DAD DD 0 000000 0000000000000 0 U‏ 
DAD DDD 0 euggi MOD 0.0 0 D 0 U‏ 00000000000000000 
DAD 00 0000000000 U‏ בםםםםםםםםםםםםםםםםםםם 

U D D D D 0 00 DD zone struct( zoe הט‎ D D D D D 0 0 D 
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0000000000 pdlist datar] [| O | Include/linux/ nmzone. h[] O 
typedef struct 115% data + 
zone t node zones[ MX NR ZONES]; 
zonelist t node zonelists[ GP ZONENMSKH] 
int nr zones; 
struct page *node nem nap; 
unsi gned l ong *valid addr bi tnap, 
struct bootnemdata *bdata; 
unsi gned long node start paddr; 
unsi gned long node start napnr; 
unsi gned 1 ong node si ze; 
int node id 
struct pglist data *node next; 
} pg data t; 
D 0 UD D በበበ በ pdist datar t D D D D በ በ node next [] D D U D 0 D D 0 U 
D D [በ D D D node nemnap D O00000 page] 0 D D J D D node בה‎ 
0000 30000000 


O pglist data] [1 000000 node 158 D DD D D 0 D D 0 D 0 D D 0 0 
typedef struct 200611 51. struct + 
zone + *zone[ MX NR ZONEH]; //NIL 0611 01160 
Int gfp nast; 
} zonelist t 


nog zoneJ00000000000000000000000000000000 
U D D 00 zonet OD D 0 0 0 D D D 0 D D D D D D 0 0 zonet 10 0 d DU D D (D D DT 
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OO000000000000000000000000000000000000 009 
U 10000 5000 DAD DD DD DDD @N DAD D 30000000000000 
ANG M000 50 D 0 0 0 D D D D D zondist ti DDD D DDD 0000 DDD U 
D 00000 DDD DD DDD DD D D pdist הא‎ በ በ D በ በ zondist t (10 DU 
0000 MGPNK 100] 
































624 0000000000 


DD me 0 D D D 0 bootnem] D [] (Bootnem‏ םםםםםםםםםםםםםם 
D D DD D D D D D 0 00 DD DD DU DDD DD 0 D 0000 D D D D 0 0‏ האוא 
ed 0 000 00 U‏ םםםםםםםםםםםםםםההותא start‏ בםםםםםםם 
D D 0 0 D D D D 0 D 0 0 DD‏ א 00 8680000 בםםםםםםםםםםםהם 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 


D 0 D 0 0 D DDD DDD D 0] D bootremdata] D mom. cD | O 
typedef struct bootnemdata { 
18151 gned long node boot start; 
unsi gned long node low pfn; 
voi d "node boot nem nap; 
unsigned long last offset; 


unsigned long last pos; 
} bootnemdata t; 


node boot start D D 0 O0 bootnem] O0 1 0 0 0 D D 0 D 0 0 D 0 D 0 0 0 0 0 
OW 

node lowpfn D 111111 [1 D [| D D በ በ 896M] 

node bootnemnap[] [| boot nend] [| 

last offset םםםםםםםםםםםםםםםםםםםםההה‎ last pos OOO 
U U 

last ps N הםםם םםםם‎ D D 0 0 0 D 00 0000000000 
. alloc ከ0ዐ[0በዌበርር!6ዩ()1] | | 0 D 0 D 0 0 0 D D D D D 0 0 0 0 0 D 

U በ D በ boten 0000000000000 nm boot nene. c [| [| 


10 init bootnen()n D 








unsigned long _ init init bootnem[] unsi gned long start, unsigned long pages[] 
1 

nax low pfn = pages; 

mn lowpfn =start; 

return] init bootnemcore[] &contig page data, start, 0, pages] [] ; 


} 

U DDD DD D D D DD D 0 D מסםםםםםםהםהה [מסס‎ 
init bootnemcore()Q 00 D D D D init bootne 000000 start 000 D a p 
U D D D 0 0 00 pages D D D 0 D 0 D D D D D D D 0 0 D D init bootnemcoref)[] 
OO contig page data) D D 0 0 D 00 D D D D 0 0 0 D D D D D D 0 0 0 
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int nunmodes = 1 /* Initialized for [እል platforns */ 























static bootnemdata t contig boot nem data; 
pg data t contig page data = + bdata: Geontig bootnemdata L 
OO contig page data] D D D D D D D D D pg data በ 1 1 I DD ם‎ pg data t 
በበበበበበበበቨበበበበበበሀበበበበበበ[በ[በ[በ MODO 
contig page data] D በ NAD D D D D D D D DAD D 0 DD 0 0 DD 0 DD 0 D 00 በ 
000000 psa dtat O00000 node መ DD 0 0 0 0 D 00 D 0 በበበበበ[[ 
pgdat list 1 11 | D D (D በ፲ በ በ በ በ በ በ በ [contig መመ data] D 00000000 
בםםםםםםםםםםםםםםםםםםםםםםםהםםטםםםםםםםםםםם‎ 
pg data L D 0000000 
pg data L] 1 [| U ה ה‎ Ú] bdata[] contig page data O 00000 bootnemdata t 
D D D D 0 DDD D DD int bootnemcore] 0 D D Hl D D 0 0 D 
/* 
* Called once to set up the allocator itself. 
*/ 
static unsigned long init init bootnemcore [] pg data t *pgdat, 
unsigned long napstart, unsigned long start, unsigned long end] 
1 
bootnemdata t *bdata = pgdat- >bdat a; 
unsi 0060 l ong napsize = [] [] end - start] ተሻ] /8 


pgdat- “node next = pgdat list; 

pgdat list = pgdat; 

napsize =[] napsize +] sizeof] long] - 111 [] ጩ ቴ] sizeof long] - 111 ; 
bdat a “node boot rem nap = phys to virt[] napstart << PAE SH FI[] ; 

ከ0818 “node boot start = ][ start > PAGE SH FI] ; 

bdat a- “node low pfn = end; 


/* 
* Initially all pages are reserved - setup arch] [| has to 
* register free RAMareas explicitly. 

*/ 

nenset[] bdata- “node bootnemnap, Oxff, napsi ze] ; 


return napsi ze; 

} 

በበበ] 111000 [ U 

e 00 mapsizel DDD D DD D (end - stat) J00000000000 7000 
םםםםםםםםםםםםםםםםםםבא בםםםםםם‎ 80000 

e DD pgdat list D DDD 0 በበ በበበበበበበበበበበበበበበበበበበበበበ[ 
pgdat list 0 0 0 D D 

e በበበበበበበ መጩመበበበበቨበ 4000040 መጠበበጠበበበበበበጩ 
D DDD DDD DDD DDD DD sized ה .ה ההםהםםםםםםםםה:‎ 4 
0 10 0 #4 DI (00001000811111100)) 0000000 00 D DDD 80 D D 0 0 0 0 
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nensize | 40000 
e phys to virt(napstart > הצ‎ D D 0 D 0 D D 0 0 D 0 0 0 L 
e 110000000000[0 node boot start] D O O 0x00000000 T] 
e 00000000000000 node lowpfn] 
*。00000000000000000000000000 1000000000 
e 00000000 


20 free bootnen( ) [] 


enu‏ םםםםםםםםםםםנעםםםםםםםםםםםםםםםםםםםםם 
በገ በ 0 U D 00 0000 U‏ 


U D D 0 U 
void init free bootnem[] unsigned long addr, unsi 0060 long size] 
t 














return] free bootnemcore[] contig page data bdata, addr, size[ [ ; 


} 
D D D D D B በ (free bootnremh D D D በ በ UD D D በ በ D free bootnemcore() 


םםםםםם 
static void init free bootnemcore[] bootnemdata t *bdata, unsigned long addr, unsi gned‏ 
long si zef]‏ 
1 
unsi 0060 long i;‏ 
unsi gned I ong start;‏ 
*/ 
round dom end of usable nem partially free pages are‏ * 
consi dered reserved.‏ * 
/* 
unsi gned 1 ong si dx;‏ 
unsi gned long ei dx = ][ addr + size - bdata- “node boot start] /PAGE SIZE‏ 
unsi gned long end = [] addr + size] /PAGE SIZE‏ 


if D !512፪] BAD; 
if [ end > bdata- >node 1 ow pfn|] 
BGO; 


/* 
* Round up the begi mi ng of the address. 
*/ 
start =] addr + PKE SIZE ፲| / PAE SIZE 
sidx =start - [] bdata- “node boot start/ PACE SIZE]: 


for Ji =sidx; i «eidx; if + 
if [] !test and clear bit] i, bdata- “node boot nem nap) [| 


BHD; 
} 


} 
U U U U D U 0 U D U 
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םםםםםםםםה ה OO‏ * 

e 00 םםםםםםםםםםםםםההרפ‎ 

e U UU UU UU DUDU U 

e start D 000000000000000 Hd sidxstart indx)0 0 000 
HH node boot start 111 [| Ú 

e 00000 sik] ዉዉበበበበበ009[000000000ቨ 


3] reserve boot nent) [] 


OO00000000000000000000000 ዜክ ጩጪጩበበበ0በ0[00[0 
1000 


U D D 0 U 
void init reserve bootnem[] unsi gned long addr, unsi gned 1 ong size] 
1 




















reserve bootnemcore[) contig page data bdata, addr, size] ; 
} 


reserve bootnemy םהה ה‎ [| [| [] [] [| [] [] [] [] reserve bootnemcore] [ D D 0 
static void init reserve bootnemcore[] boot mm data t *bdata, unsigned long addr, 
unsi 0060 | ong 51281] 
{ 


unsi 0060 1 ong i; 
/* 

* round up, partially reserved pages are considered 

* fully reserved. 

*/ 

unsi gned long sidx = [] addr - bdata- “node boot start[] /PAGE SIZE 

unsi gned long ei dx = [] addr +size - bdata- mode boot start + 

PACE SIZE 1] / PAGE SIZE 

unsi gned long end = [] addr + size + PAE SIZE 10 /PXE SIZE 


if [] !size] BAIN; 


if [| sid <Q 
BRO: 

if Deidk <Q 
BRO; 

if [] 510 >= ei dx] 


BRO: 
if [] [] addr > PAE GU DUT >= bdata- node low pf] 
BG] []: 
if [ end > bdata- node low pf nf] 
BRO: 
for Ji =sidx; i <eidx; if 
if [| test and set bit i, bdata- “node bootnemnapl] [] 
printk] "hm page 59818 reserved twce.Vn", i*PAE SIZE] ; 





} 
0000000000 
e sid (start index)] 000000 node boot start [1 [1 [1 D] Ú 
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Uu שםםםםםםםםםםםהה=‎ 
OO md 00000 DDD 00000 DD 0 D በ UI 
U U 0 U D U 00000 U 
U DD DD sik ዉሕበ[በበቨ [በ 1D 


4] _ alloc_bootnent)]] O 


DD DD 00000‏ 0 ו םםםםםםםםםםםםםםםםםםםםםםםםם 
U U U U U U‏ 


U U uu 
void* 81106 bootnem[] unsigned long size, 
unsi 0060 1 ong align, 
unsi gned 1 ong goal [] ; 
void * | 81106 bootnemcore [] bootnemdata t *bdata, 
unsi gned 1 ong size, 
unsi gned 1 ong align, 
unsi gned long goal[] ; 
OO alloc bootnen()[ 0 000000000000 alloc bootnemcore [| [T] 


U D _alloc_bootnemcore [|] D 000 0 0 0 0 000 0 0 0 0 D LI 0 DI 
unsigned long i, start = 0; 
voi d *ret; 
unsi gned long offset, renaining size; 
unsigned long areasize, preferred, incr; 
unsi gned 1 ong ei dx = bdata- >node low pfn - 
0 bdata- “node boot start >> PACE SH FT] ; 
በ]መዉጩበበ በበ] በበበ በበበበበበበ 
if ה‎ !size] BAD; 
if [] align &[] ali gn- 1] [] 
BRO; 
םםםםםםם‎ 
/* 


* Vé try to allocate bootnempages above ' goal' 

* first, then ve try to allocate lower pages. 

k; 

if [ goal &&[] goal >= bdata- mode boot start] && 

[| ם‎ goal >> PACE SH PI < bdata- mode lowpfn] | + 
preferred = goal - bdata- “node boot start; 

} else 

preferred = 0; 

preferred = ][ | preferred +align - 19 &4 align - 11] 0 之 PAGE HFE 
በገ] D 0 D 0 D 0000 00 U 
01000 ga 00 00 በ በ በ በ D preferred] םםםםםםםהםהה‎ 0 
0200000 align 000 preferred 00000 
areasi ze = ][ si ze+PAŒ SIZE 1] / PXE SIZE 
በገ] በበ1|]ቢበበ በ 0 D 0 U 
incr = 8110. << PAGE HFT? : 1; 
O00000000000000000 םםםםםםשהההאא‎ 10 
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restart_scan: 
for i =preferred; i <eidx; i +=incrg + 
unsi gned 1 ong [ ; 
if [test bit[] i, bdata “node boot nem nap] O 
conti nue; 


OO00000000000000000000000tet BitOoOOOOOOOOOO 
000000 0000 10 


for Dj =i +1; J «i +areasize HO + 
if Oj > eix] 
goto fail block; 
if [] test bit Qj, bdata-2node bootnemnap] [| 
goto fail block 


} 
U U U U D U D 0 0 0 D 0 0 0 0000 00 0 0 U D U 0 0 0 000 00 0 0 U UD 
00000 fail block] 


start =i; 
goto found; 
האנ םםםםםםםםםםםםם; םםםםםםםםםםםםם‎ O00 
fail block: ; 
} 
if preferred] 1 
preferred = 0 
goto restart_scan; 
} 
return NIL; 
በበ 1በ1]በ በ በበበበበበቨበበበ[በበ[በ[በበ በ [ በ በ preferred[ D [J 


በበ 00000000 preferred] 1P OD D 0 0 0 0 D 0 D 0 DDD DD በ በ NW 
found: 
םםםםםםםםםהםםםהםםםםם‎ 
if [| start = ei dx[] 
Bal; 




















םםםםםםם 
*/ 
Is the next page of the previous allocation end the start‏ * 
of this allocation s buffer? If yes then ve can ' nerge'‏ * 
the previous partial page wth this allocation.‏ * 
/* 
if [] align <= PAE SIZE && bdat a- > ast offset‏ 
bdata- Å ast posH = start[] +‏ 68 
ast 011560 811 ₪ 1] @-f] align 1]:‏ ב offset = [] bdata-‏ 
if [ offset > PAE SIZH]‏ 
BUG] D ;‏ 
renai ni ng size = PA SIZE offset;‏ 
በ‏ 1111111000 
040 0100000000000000 


02000 last offset DU MONO O000000000000000000 
U U 0 U D 0000 U 
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םםםםםםםםםםםםםםםםםםםםםםםםטםםםםםםםםםםםשם 
U U 0 00 U‏ 
3000000000000000000000000000 מםםם 


renai ni ng size] 
if [] size <renaining size] + 
areasi ze = 0; 
// last pos unchanged 
bdata- Hast offset = offset size 
ret = phys to virt[] bdata ב‎ ast_pos*PACE SIZE 
+ offset + bdata- mode boot start[] ; 

U U D 0 D 0 0 D D 0 D 0 D D 0 D 0 D D D 0 0 0 0 0 D D D 0 D D 0 D 0 0 0 0 U 
OOOO last offset DO 0 D D DD DDD last ה‎ DD ü DD DD DDD D 00 0 U 
OOOO000000000000 ret D በ በ phys to virt OD D D UU D 0 00 DDD U 

} else + 
renai ning size =size - renaining size; 
areasi ze = [] renai ni ng size+PAGE SIZE 11] / PAGE SIZE 
ret = phys to virt[] bdata ב‎ ast_pos*PACE SIZE 
+ offset + bdata- “node boot start[]; 
bdata- 3 85% pos = start 7870851 ze- 1; 
bdata- Aast offset = renai ni ng si ze; 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ last pos [ 
last offset[] 

በበ በበበ በበበበበበበበበበበ 8000 3000000000 12KB 9KB=3K8] 
በ] D | መመ offset] ዝመቭ D 0 D D 0 0 መቭበበበበበበ[በ 18000 3000000 
በበበበበበበበበበበ[በበበበበበ םםםםה הא‎ በ (10B 3g + 
PACE SIZE 1(/ PACE SIZE] ה2 ה‎ 000000 page offset] 3KB] 

T 
bdata- A ast offset & ~PAGE MK 
} else { 
bdata- 3. ast pos = start +areasize - 1; 
bdata- 3 85% offset = size & -PXE MSK 
ret = phys to virt[] start * PAE SIZE + 
bdat a- “node boot start[] ; 



































} 

U D DDD በበበበበበበበበሀበበበበ[በ DD D 00 D [በ ሀበ ሀ በ ሀ last pos] 
last offset I 111111 DDD D 0 DDD 0 DD last post d B ü D 7B. U U U D] 
00000 page offset "םםםםםםםםםםםםהםםםםםםםםהההה‎ size & 
PACE MR'I PAE MSK[] 0x00000FFH] || PACE MS D D 0 0 B. D. D | በ በ 0 DT 

/* 
* Reserve the area now 
Vi 
for Ji = 55876; i <start+areasize; i+] 
if [] test and set bit] i, bdata- “node bootnemnap]] O 
BUG] D; 


nenset[] ret, O, size]: 
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return ret; 
OOO000000000000000 test and set םםםםםםםםםה הג‎ 
000000 00 DD DD DONG wood ጠበበበበበበ[በበበበበ[በበ[በበበ[ 
በበበበበበበበበበበበበበበበበ RA D D D 0 D 0 0 0 D 00 D 0 ጠበበበበበ 
U U U 0 0 U 


3) free all oot nwn) [| 


U D D DD 000 DD DD D D 0 D በ bootnent] OOO 


U U D 0 0 U 
voi d free all bootnem[] void] ; 
voi d free all bootnemcore[] pg data t *podat[] ; 


U D 0 DD DD 0 םם‎ D በ በ free all botnen D 0 D 0 D 0 D D 0 D በ0 
free all bootnemcord] [| [| [| [| [] [] [] free all bootnemcore] | H D U U D Ú 


000 








struct page *page = pgdat- “node nem nap; 
bootnemdata t *bdata = pgdat- 20081; 
unsi gned long i, count, total = 0 

unsi gned I ong i dx; 


if [] ! bdata- “node bootnemnap] BUG] [] ; 
count =0; 
idx = bdata- mode low pfn - [] bdata- mode boot start 
<< PAE SH FT] ; 
በ181በ11በበበበበበበበበበበቨበበበበበበበበበ[ 
for Ji =0 i «idx i+; page] + 
if [] !test bit] i, bdata- “node bootnemnap ] + 
count ++ 
G earPageReserved] pagel] ; 
set page count[] page, 10 ; 
. free pagel] page] ; 
› 
T 


OO boctnent] | O D UD D UD በ መጨጩጩ[ D [ D D 0 ሀ D በ በ Dset. page count() 
000 page[] OG cout D 10 0 free paot 70 CH 0 B. D D D D D D D D D 0 buddy] 


U U U U 0 U 
total += count; 


/* 
* Nowfree the allocator bitnap itself, it's not 
* needed anynore: 
*/ 
page =virt to page] bdata- “node bootnemnap] ; 
count =0; 
for גה‎ =0; i <Q ][ bdata- mode low pfn-[] bdata- node boot start 
>> PACE SH FI[] [| /8 + PACE SIZE ፲] / PACE SIZE 
i+; page+£] 1 
count +; 
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G earPageReserved] pagel] ; 
set page count[] page, 10 ; 
_ free pagel] pagel] ; 
} 
OG boote D D 0 D D 0 D 0 0 D 0 D 0 0 0 
total += count; 
bdat a- 26006 bootnemnap = NIL; 
return total; 


በ D D D D D DN bootnemnap/] OO NID DD 00000 00 0 U 


625 00000 


በገበበበበበገበበበበበበገበበበበበበበበበበበበበበበበበበ[በ[በ[በበ[ 
םםםםםםםםםםםהםםםהםםםהםםהםםםהםםםהםםםםם‎ 

pagi ng init() 00 

pagetable init() [] [] 


19 pagi ng init() OO 


0000000000000 setup הא‎ D 0 D 0 0 0 DD D D D D 0 D D D D D [ 
pagetable init] [] ; 
U D DD 0 0 D 0 D 0000 DDD 0 D DD D 0 0 D በ; 
. asm | "nov %%6cx, ran" ::"c"[] ፲፻] svapper pg dir] OO; 
OO pagetable 1፲1()11101000[[ D swapper בםםםםםםםה האש‎ 

በ O80000 

፳፲ GONIGXB6 PAE 

/* 

* W wll bail out later - printk doesnt work right nowso 

* the user would just see a hanging kernel. 

*/ 

if [] cpu has pae[] 

set in cr4[] X86 CR PAE] ; 
#endi f 








— flush tlb all; 
0000 000000000000000 BOND BB 0000000 


000000000000000 D 0 D 0 B00000000 
#fdef CNI G H GMM 
knap int] [] ; 
#endi f 
U D D 0 D GNIGHGMMIJ[I, D 0 0 D D $M[J0000000000000 
U D 0 D 00 D 00000 U 
1 


unsi 0060 long zones 5120] MX NR ZONES] = (0, O, 0) 
unsigned int nax dna, high low 


ML 









































[ Linux [ 
nax dna =virt to phys] [| char *] MX DM ADRESS] 
>> PACE SH FT; 
OO הא‎ 000000 ወዳ D D DD DDD 0 DD D በ በ 16እጅ[ | D [| 
low = max low pf n; 


high = highend pfn; 








if J low > nax dra] 
zones 5120] ZONE IM] =low 
else { 
zones 5120] ZONE IM] = nax dna; 
zones 5120] ZONE NRML] =low- max dna; 
#fdef ONIGHGMM 
zones si ze[ ZN: HGMM = high - low 
#endi f 
} 
OO 3000000000000 zones size run 3000000000 
° ZOE DMU [] 0] 168] 000000 
° ZOE NEM በ 168] 89680 000000 
° ZOE DAD 8968] 10000000 
free area init[] zones size] ; 


) 


return; 


U U U 0 0 0 0 00 0 UD D 0 U D 0 0 D U 0 U DU D UD U D 0 D 0 D 0 0 U 
20 pagetabl e init()[] [| 


swper pg dir( Dn D DD DD DDD D‏ םםםםםםםםםםם 
unsi 0060 1 ong vaddr, end;‏ 
pod t *pgd, #pgd base;‏ 
int i, j, k‏ 
pnd t *pnd;‏ 
pte t *pte, *pte base;‏ 


/* 
* This can be zero as well - no problem in that case ve exit 
* the loops anyway due to the PIRS PER * conditions. 
*/ 
end = [] unsigned long] val] nax low pf n*PAŒ SIZE]: 
OO nx lowpfn םםםםםםםםהםהםהה‎ end በ 
pgd base = svapper pg dir; 
ם‎ pod base (000000) OO swapper pg dir] 
፳፲ ONIG X86 PAE 
for Ji =0 i <፻ጩ PER PD 149 
set pgd] pgd base +i, _ pod] 1 + pal] empty zero page] DO; 
Hendi f 
OO היא‎ D O FIR PER ף השא‎ 40000 swper pg dir 00000000 
O set pgd() OO incl ude/ asmi 386/ pgtabl e- 3l evel. h[] [| 
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i = pod offset] PAGE CFESEIT] : 
pgd = pgd base +i; 
(| pod offset) 0 D D DDD 0 D D D D 0 DDD 0 D D 0 D pod offset] PAE. 
FEIT D D 0x300] በ OOO 70T D D 0 0 0 0 0 0 D 0 0 0 D 0 0 በ በ፣መበበበ በ 


U 0 D 000 7680 0 
for D: i <፻ጠጩ PR PG) p+ i+ + 
vaddr =i*PGIR SIZE 
if [] end 680 vaddr >= end] 0 
break; 
U D DD D אסאס‎ PAEQ OO PR eR PDD 0 0 D D D 0 0 D D 0 D D D 
10240 0 D D D D D 0 D PARS ZEN D D D D D D D D 0 0 D 0 D 0 0 RAMT D CU U [] 
U 0 D D D AM በ D በ GNIGX6 PÆN D D D D D 11ቭ11 | D በ D vader በ በ በ 


U U D D D ገበ 0 D 0 0 D D U 
፳፲ ONIG X86 PAE 
pnd = [] pnd t *[] alloc bootneml ow pages[] PACE SIZE] ; 
set pyd] pgd | pod] pal] pn] +0x10 U; 


Helse 
pod —[] pd + *0 pod; 
Hendi f 
U D D 0 D @NIG X6 PÆN םםםם‎ 0 D D በ ዌቭ] | D በ በ botnen [0000 
U D DD 0 0 D DD 00 DD DD D D D D 0 D D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 


U D D D 0 0 0 U 
if [] pu ! = pnd offset] pod 00 0 
BG] n: 
for Qj =0 j <PIRS PER PM) pi}, j+#] + 
vaddr =i*PGIR SIZE + j *PND SIZE 
if [] end 68 || vaddr >= end] [] 
break; 
if D cpu has pse] + 
unsigned long pe; 
set in cr4] 386 (፲8 PSE] ; 
boot_cpu data. wo works ok = 1 
pe = KERNG TME + PACE PSE + pal] vaddr[] ; 
/* Mike it "global" too if supported */ 
if D cpu has pge[] + 
set in cr4] 386 CM PH] ; 
| pe += PAE GOA, 




















} 
set md] pnd, pod] pe; 


conti nue; 


} 
በበ በበ D በበ 0 0 DU 0 0 0 መ ሽበበበበበበበበበ DD 0 0 0 0 0 0 0 0 0 0 U 
U D D DD D PAR] PMSIZEQ D D D OOOO vaddr =i * הא‎ 0000 0x300[] 
םםםםםם‎ 0x300 * 4NB 3G] D 0000000 PSH] Page Size Extension) [| [ 
םםםםםםםםםםםםםםםםםםם‎ 480000 cpu has pel 0 0 0 0 D D HD 
OOO000000000000 set in םהה(‎ 
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Pentium II D D D 0 D D D D D [ 0 D 0 D PŒ (Page 0ጩ Enahle)[] D] EL D D]‏ ם 
መ DDD 0000 DDD D መበበ[በ[በበበበበበበበበ‏ םםםםםםםםםםםם 
2 ההםהםםםםםהםםםםםםםםםםםםםםםםםםםםםםם 
מםםםםםםםהםםהםםםהםםםהםם 
pte base = pte =[] pte + 4]‏ 
alloc boot nem] ow pages[] PACE SIZE] ;‏ 
በበ]መበገበገገ በ በበበ በበበበበበበበ 488) 00000‏ 
for | k =0 k <PIRS PER PIE pte; Kl +‏ 
vaddr =i*PGIR SIZE + j *PMD SIZE + K*PAE SIZE‏ 
if [] end &&] vaddr >= end] []‏ 
break;‏ 
PR] 00 5200000000 4 10 (CTI‏ 102400000000 0000000 
*pte = nk pte phys] pal] vaddr[] , PACE FMI):‏ 
} 
nk pte pys OI 0000000000000000 0 O _pavaddr)0 OO‏ ם 
PACE KERNL[] D 0 0 000000000000000‏ 
set png] pnd, _ pnd] KERNGTAHE + pal] pte base] QQ;‏ 
if [ pte base !=pte offset] pnd, 00 0‏ 
BUND;‏ 



































) 


) 
OOOO set መ(1 DD DD D D 0 0 0 DD DDD 00000 DD D D 0000 U 
000000000 PAE GFSEOOOOOOOOOO 
/* 


* Fixed nappings, only the page table structure has to be 

* created - nappings wll be set by set fixnap] [ : 

#[ 

vaddr = fix to virt[] end of fixed addresses - 1] &PM MK 

fixrange init[] vaddr, O, pgd base] ; 

U 0 D 0 D 4 הא‎ 111111 110010001010101ሀ101000000: 

[|] [| [| [| [| [| /incl ude/ 8511138085 h[] 00000 end of fixed addresses | 70 [] D 
O0_fixtovirtO0 000000000000 fixrange iinitOOD0 000000000 
U D D DD D 00 0 0 D 0 0 D 000 00 0 0 0 [በበ በበበ በበ በ በ በ በ set_fixnap() 
utt 








vaddr = PKMP PASE 

fixrange init[] vaddr, vaddr + PACE SIZE*LAST PKMP, pod base] ; 
pgd =swapper pg dir + pod offset] vaddr[] ; 

pnd = pnd offset] pgd, vaddr[] ; 

pte =pte offset] pnd, vaddr[] ; 

pknap page table = pte; 

#endi f 





00000 CGNIGHGNMIIDDDUDDDUDU መወመመበበበ00000000[ሀ0ሀ 
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PMP PASE] D [] OxFF000000[] DO‏ בםםםםםםםםםםםםםםםםםםםםם 
4064NHT] LAST PMP D በ | 1024] 0000 40480000 fixrange int 00 O00‏ 


00000000 ወመበበ D DD DD D D 0 00000000 pkrap page table] 
፳፲ ONIG X86 PAE 
/* 
* Add low nenory i dentity- nappi ngs - SMP needs it when 
* starting up on an AP fromreal- node. In the non PAE 
* case we already have these nappi ngs through head. S. 
* Al user-space nappings are explicitly cleared after 
* SM startup. 
*/ 
pgd_base[ 0] = pod base[ USER PIRS PER PG); 
Hendi f 














626 00000 


AN DM AN. NMA ]‏ 3000000000 םםםםםםםםםםםםםםם 
d Hd B D‏ םה B‏ םה |][ ZOE ₪ [| [| [| D O struct zone struct I‏ 


incl ude/ 1 i nux/ nmzone. H] 

typedef struct zone struct 1 

/* 

* Conmmnly accessed fi el ds: 

*/ 
spi nl ock t lock: 
unsigned long free pages; 
unsigned long pages min, pages low pages hi gh; 
int need bal ance; 


/* 
* free areas of different sizes 
*/ 
free area t free areal MX (NER: 


/* 
* D 50011 0 nenory support fields. 
*/ 
struct pglist data “zone pgdat ; 
struct page *zone nemnap; 
unsi gned | ong zone start paddr; 
unsi gned 1 ong zone start napnr; 


TE 
* rarely used fields: 
*/ 
char *nane; 
unsi gned | ong size; 
} zone t; 


#defi ne ZONE DA 0 
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#defi ne ZONE NML 1 








tidefi ne ZONE H GNM 2 

#defi ne MX NR ZONES 3 

U struct zone struct [] [] [1 D D 0 U D 0 0 0 U 

e 10ዚ1111110101010101011000000.0 

e free pages [] LH D] 0 DD DDD DD D በ 0 D 

° pages ninpages low] pages high] הה‎ 0 0 ü 0 D 0 0 D 0 0 0 0 0 0 D D D 
e need balance] [| ksvapd[] [] [1 0 0 [ Ú 

e free area] DD DDD U D FU UU D DDD U 7. 7. U 
e zone pgdat[] 000000000000 

e zone nemnap] [] D (1 D (] Ll] D D D D U 

e zone start ₪ D D D D 0 B. B. 0 0 D 0 0 

e zone start napnr[] | nemnap[] ה‎ [] 1 D D D 0 U 
e nn DD 11 D 0 D D 

e szadOOOOOOOOOOOOO 

















000 free area t [] [| [] 
#ifine MX 3 10 
type struct free area struct + 
struct list head free list 
unsigned int *nap 
) free area t 
OO D zone struct 0 D | [| free are] MX RERO OO“ DDD D" 000000 
U U D 0 D 0 D 0 D 0 D D D 0 D 0 0 D 0 D 0 D D D D D D D 0 0 0 0 D 0 D 0 0 U 
U U D 0 D 0 D 0 D 0 D D D D D D 0 D 0 D 0 D D D D D D D 0 0 0 0 D 0 D DDD 
םםםםםםםםםםםםםםםםםםםםםםםם םםםםםםם‎ 200000 
OOOO 4] 8] 18] ...... [00 2'መማ]በ 44000000 
D D D 0 DD D 0 D 0 0 0 D D D D 0 በ struct page D DD D incl ude/1i nux/ mh] 

















OOO000000000000000000000000000 


typedef struct page 1 
struct list head list; 
struct address space *nappi ng; 
unsi 0060 1 ong i ndex; 
struct page *next_hash; 
atomic t count; 
unsi 0060 1 ong flags; 
struct list head lru 
wait queue head t wit; 
struct page **pprev hash; 
struct buffer head * buffers; 
voi d *virtual; 
struct zone struct *zone; 
) nemnap t; 
םםםםםםםםםם‎ 
e list QOOO00000000 
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napping 1 1111111110 DI D D D D D D 180061] 
index] 00000000 
next hash] D 0 D D D B D D DD D D 0 DD 000 0 
count] [] D D] D] D] D D [በ U 
םםםםםםםהםהםהפפם‎ 
1፲ዢ[| QO active list [| Ú 
Wat LD D D D 1 D D D በ 0 [| 

pprev hash] | next hash] [] D] Ú 
buffers] 0000000000000 
zone] D D 1 11 D 1 D U [] 
םםםםםםםםם‎ 30000000 
e free area init() QOD 

e build zonelists() OOO 

e neminit() [] D [] 














o 








11] free area init() [] [] 


mpage all oc. c[] ከ‏ בםםםםםםםםםםםםםםםםםםםםםםםהםם 
U uuu‏ 


voi d free area init[] unsigned long *zones size] ; 

void free area init core] int nid, pg data t *pgdat, 
struct page **gnap, 
unsi gned long *zones size, 
unsi gned long zone start paddr, 
unsi gned long *zholes size, 
struct page *l nemnap] ; 

free area init] 00000000 free area init core] החהםהההההההה‎ 


םםםםםםםםםם 
struct page *p;‏ 
unsi gned longi, j;‏ 
unsi gned ] ong nap size;‏ 
unsi 0060 1 ong total pages, offset, real total pages;‏ 
const unsigned long zone required ali guent = 1U >> | MX CHER 1[] ;‏ 


if [] zone start paddr & -PACE MSK] 


BUND; 
U U U 0 D 0 0 000 0 D 0 0 D D 0 U D 0 (U 
total pages = 0; 


for [i 20; i «MX NRZONS iH] + 
unsi gned long size = 2005 1 
total pages += si ze; 


} 
በገ U 1011009000 


real total pages = total pages; 
if [] zholes size] 
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for Ji 20; i «MX እዚ ፲እር% i +f] 
real total pages -=zholes size[i]; 
print k] "Ch node 58 total pages: Gun", nid, realtotal pages] ; 


000000000000000 
INT LIST HAD] Gactive list] ; 
INT LIST HAN] Si nactive list] ; 


00000000 

/* 
* Sone architectures [] wth lots of nemand discontinous nenory 
* naps] have to search for a good nemnap area: 
* For discontignem the conceptual nemnap array starts from 
* PACE CFFSET, ve need to align the actual array onto a nemnap 
* boundary, so that MP NR works. 
N) 
nap size = [| total pages + 1][ *sizeof[] struct pagel ; 
if [] lnemnap = ][ struct page *[] O] 1 

lnemnap = [|| struct page 4] 

alloc bootnemnode[] pgdat, nap size] ; 
I nemnap = ][ struct page *[] [| PACE ŒFSET + 
MP ALIGN] [| unsi gned long] Inemnap - PACE GREN [] ; 























} 
OOO0000000000000000000000 sizeof(nemnap t) ה‎ 0 D D 


U U 
*gnap = pgdat- “node nemnap = 1 nem nap, 
pgdat - “node size = total pages; 
pgdat- “node start paddr = zone start paddr; 
pgdat- “node start napnr = [] 1 nemnap - remnap] ; 
pgdat- “nr zones = 0; 
םםםםםםםםםם‎ 
/* 
* Initially all pages are reserved - free ones are freed 
* up by free all bootnem] [| once the early boot process is 
* done. 
*/ 
for [ כ‎ =1nemnap; p <lnemnap +totalpages; pH] + 
set page cout] p, O]: 
Set PageReserved[] pi] ; 
init veitqueue head] Sp- ait] ; 
nemist init] Sp 1ב‎ 5%|[ ; 
› 
U U D 0 D 0 0 D 0 0 D 0 D D በ [በ በ 
ui D D D 0 D 0 በ በ cout D 0 D D oj 
U 271 D 0 DD DDD D 
በሟጋበበበበበበበ[በ[በበ 


O4000000000 


offset = [ nemnap - nemnap; 
DU nemnap[] O [ [] struct pages [| D | [| [| | [] nemnap OU D D 0 DO D U 
םםםםםםםםםםםםםםםםםםםםםםםםםם‎ ጠበበበበ[ 000000 0 
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U U U 0 D U D D D 0 0 D U D D D D D U mœmnanp 0 0 0 0 0 0 0 0 0 0 0 0 0 D 0 U 
00000 zone האפ‎ (] (] D D D D D D D 0 D D 0 በ በ በ በ node ጩዉጩ[ OOO 
U D D 0 D 0 D D D 0 D D D D D pemnapl U 
000000000 הא‎ D D 0 D D D D D 0 D D 0 D D remnap[| 000000 
D UD D DD offset] DOO” iaaer DD 0 DD 0 D U 
for 13 50 j «MX እኳ 43፡5 jH + 
םםםםם‎ 26በ1በ11[[0[ D L 
zone t *zone = pgdat- mode zones +j; 
unsi gned | ong nask; 
unsi 0060 long size, real si ze; 
real size = size = 2008 ]; 
OO0000000000000000000000000000000000000 


U U U U U 
if [] zholes size] 
real size -=zholes size[j]; 




















print k] "zone 9bu] : Yu pages.\n", j, size]; 
בםםםםםםםםם םה םםםםםםםםםםםםםםםםםםםםםםם‎ 
zone[] ፲] : 4096 pages. 
zone] 11] : 61440 pages. 
zone] 2] : 0 pages. 
000000 20 O0000 256M] RAM] 
zone- 25120 = size; 
zone mane = zone nanes[j]; 
zone- dock = SPIN LAK UN (1011) 
zone- zone pgdat = pgdat; 
zone- >free pages = 0; 
zone- >need bal ance = 0; 


U U D 0 D 0 0 D 0 0 D U 
if [] ! size[] 
conti nue; 
םםםםםםםםםםםםם םםםםםםםםםםם‎ 
pgdat- “nr zones = j H; 
nask = [] real 81 26 / zone bal ance ratidlj IQ ; 
if [ nask > zone bal ance nin[j 10 
nask = zone bal ance mnlj [; 
else if [|] mask > zone bal ance nax[j ][] 
mask = zone balance nax[j ]; 
םםםםםםםםםם‎ 
zone- >pages_ mn = nask; 
zone- >pages 1 ow = nask*2; 
zone- >pages_hi gh = nask*3; 
zone- zone nemnap = nemnap + offset; 
zone “zone start napnr = offset; 
zone zone start paddr = zone start paddr; 


በበ] በ በ U 0 0 U U U 0 0 በሀ በበበ በበበበበ mmap D |] D d D DU 
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zone nemnap[] [| |] U [1] [| ;] nemnap[ NOON zone start napnrl] 
if [] [] zone start paddr > PAE SHFT] & 
[] zone requi red ali gment- 1[] [| 
printk] "BUG wrong zone alignnent, it wll crash n'n ; 









































for [Ji =0 i «size iH] 1 
struct page *page =nemnap + offset +i; 
page- >zone = zone; 
if Qj !=2እር HGMM 
page virtual = val] zone start padd[] ; 
zone start paddr += PAE SIZE 
} 
በበበበ 0 0 D D 0 D 0 D D በ D በ በ struct page 0000 zone [] ] D D 0 U 
U D D DDD zone] 000000000 ME HOM D 0 D 0 D D D 00 DD 0 D D 


OO #PAE הפה‎ D 0 D 0 0 0 0 D D D D 0 0 D 00 D D D D 0 0 0 


offset + size; 


offset D [ size] D 000 nemnap[] 0 D D D 0 D 0 D 0 U D U‏ ם 
for [i =0 ; it 1‏ 
unsi gned 1 ong bitnap si ze;‏ 
nenhist init[] &one- >free area[i].free list] ;‏ 
if Di —-MXGHER 10 +‏ 
zone free areali]. nap = NIL;‏ 
break;‏ 
› 


000 free ፳68[][] 000 free area 10 00000000000 העא‎ 

/* 

* Page buddy 5351601565 "index << ][ i H[] ", 

* where "index" is at nost "5126- 1". 

* 

* The extra "43" is to round dom to byte 

* size [] 8 bits per byte assunpti on[] . Thus 

* ve get "][ size 1] << ][ 1 4፪] " as the last byte 

* we can access. 

3k 

* ዝፀ "41" is because ve vant to round the 

* byte allocation up rather than down So 

* ሄይ should have had a "+7" before ve shifted 

* down by three. Also, w have to add one as 
ve actually use the last bit [it's [On] 
inclusive, not [0 ፲[[] . 


* 
* 
* 
* So ve actually had 4741 before ve shift 

* dom by 3 Bt [] d] <3 =[]8 ሙጃ] +1 
* [] nodulo overflow, which ve do not have[]. 

* 

* 

* 


Finally, ve LONG ALIGN because all 111020 
operations are on longs. 
*/ 
bitnap size = ][ size 1] <<] 1 41] ; 
bi tnap size = LONG ALIGN] bi tnap size] ; 
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alloc bootnemnode[] pgdat, bitnap size]; 
› 

DU D 0 0 D 0 DD D 0 D alloc botnemnode[] 0000000 
T 
build zonelists[] pgdat[] ; 

U U D U D U U D D D 0 D U 0 0; 


2] build zonelists] OOO 


ut 
static inline void build zonelists[] pg data t *pgdat[] 


00000 
int i, j, k 





for Ji 20; i « GP ZONMSK i+] + 
zonelist_t *zonelist; 
zone t *zone; 
zonelist = pgdat- “node zonelists +i; 
nenset[] zonelist, 0, sizeof] #zoneli st[] [] ; 


U U U DD DDD 1 በ በበበበበ በበበ በበ በበ በበ 
j 20, 
k = ZONE NM; 
if א גה‎ GPHGMNM 
k = ZN: HGMM 
if Di ጩ በብ 
k = AN M 
000000000 3000000000" D 000000000000000 


OO swtch[ [IU ( 
swtch[] k] I 
def aul t : 
Bg: 
/* 
* fall through: 
*/ 
case XN: H GMM 
zone = pgdat- mode zones + ZONE H GMM 
if [| zone >size] í 
# fndef CONG H GMM 
BUG] 1 ; 
#endi f 
Zonel i st- >zones[j +H = zone; 
} 
case ZONE NMI: 
zone = pgdat- mode zones + ZONE NRW; 
if [] zone =መ1281] 
200611 st- >zones[j +H = zone; 
case ZONE IM 
zone = pgdat- “node zones + ZONE DW 
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if [ zone =መ1281] 
200611 st- >zones[j +H = zone; 


} 
םםםםםםםםםםםםםםםםםםםםםםםםהם‎ የከከዉበበበበበበ0[0 
OOO0_GP DA) D D 0 D D zæelist 00000 םםםםהה האם‎ GP HGMNJ 


000000000000 AN HGMN | XN NAME XN IM] 
201611 st- >zones[j +] = NIL; 








በ NLD 0 ቨ 0 U 
30 neminit() [] [] 


U D DDD start kernel 0A DDD 0 0 DD 00 D 0 0 0 D 0000 0 0 DOD D 0 
arch/i 386/፲11፲11.01 00000000 
int 000051 ze, reservedpages, datasize, initsize; 
int tnp 
int bad_ppro; 


if [] !nemnap] 


BØD; 


#fdef CONI G H GMM 
highnemstart page = nemnap + highstart pfn; 
nax 08037 = numphyspages = highend pfn; 
በበ HGMMI 0000000 םםםםםםםםההה האאצה‎ 
#else 
nax napnr —numphyspages = nax low pf n; 
#endi f 
םםםםםםםםםםםםטםםםםם‎ 
hi gh nenory = [] void *| va) max lowpfn * PAE SIZE] ; 
םםםםםםםםםםםםםטםםםםם‎ 
/* clear the zero- page */ 
nenset[] enpty zero page, O, PAGE SIZE]: 


/* this wll put all lownenory onto the freelists */ 
total ram pages += free all bootnenj] [] ; 
reservedpages = 0; 
free all השס‎ (] | D D D 101111] 1] 1 D በ በ በ በ በ Ú በ bone OOOO 
/* 
* Qly count reserved RAM pages 
" 
for [ tnp = 0; tnp > mx lowpfn; tnpHf] 
if [] page is ram] tn] && PageReserved] nemnapJt np] [] 
reservedpages +; 
ם‎ nemnap | D D [] 0 D D D] D] D D D 0 0 D. D 
#fdef COF G H GMM 
for [| tnp = highstart pfn; tnp > highend pfn; tnpHf] + 
struct page *page =nemnap + tnp; 
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if [] !page is ram] tn] O + 
Set PageReserved[] pagel] ; 
conti nue; 














} 

if [ bad ppro & page kills pproj ty] | + 
Set PageReserved] pagel] ; 
conti nue; 

T 

G earPageReserved] pagel] ; 

set bit[] PG highnem &page- 21 ags[] ; 

atomc set[] Spage->count, 10 ; 

. free page] pagel] ; 

tot al hi gh pages +: 

T 


total ram pages += total hi gh pages; 
Hendi f 
םםםםםםםםםםםםםםםםםםםםםםםםם‎ ጩክከመጩጩበበ | በ] 
ה("‎ 000000000000000 
00005126 = [| unsigned long] &etext - [| unsigned long] “text, 
datasize = [| unsigned long] &edata - [| unsigned long] &etext; 
initsize = [| unsigned long] & init end - 
U unsigned long] & init begin; 
printk] "Mnory: 9buk/9buk available [] %k kernel code, 
%k reserved, 
98k data, %k init, 950% hi ghnenf] An", 
[] unsigned long] nr free pages] ] > 
[| PACE SHFT- 109 , 
mx mpr >> ][ PAGE SHFT 10], 
00005126 << 10, 
reservedpages >> [] PAG! SHFT- 10] , 
datasize << 0 
initsize << 0 
0 unsigned long] [D total hi gh pages 
>> [] PCE SHFF 10000; 
በገ] በበ] በበገገበበበበበበበበ 
በገ] በበበ በ በ ገበበበበበበበበበገበሀበበበበበበበበገበበበበበ[[ U 
OO0000000000000000000000000000000000000038 
OOOOO00000000000000000000000000000000000 
U D DD 0 0 D DD 00 DD DD D D D D D 0 D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 


በገ] በ በ U D በበ 0 0 U 0 0000000 U D 0 0 U D U D 0 0 0 D 00 0 000 U 








63 00000000 


U U U D U D 0 0 D U 000 000 DU 0 D U D 0 U 0 U 0 0 0 0 LD 000 00 U 
U U U በ በ U D 0 በ D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
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በገ U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D 0 0 0 0 000 U 
በገ] U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U 0 0 0 000 U 
በገ U D U NDN D 0 0 00000000 0 0 D U 0 U D U D U በበ 000 U 
DUD 0 0 0 0 DN NN D 00000 D D D D 0 0 0 DH mes 0 D D D D D UU הש‎ 




















hE, EL ር] EN 
EL JR l Bea E) 


U D D D D 00 האת‎ D GD D D D D D D D 0 0 00 DD DD 0 D 0000 D 0 U 
U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U 0 0 0 000 U 
U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U 0 0 0 000 U 
U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U 0 0 0 000 U 
U U U U DU U 









































E=J יב‎ ET E? 
ב‎ ENKE EZ 


63.1 OOOO 


0 0 10 
2000000 10000000000000 םםםםםםםםםםםםהה הא=אתגם 





























































































































D00000 000000000 20100000 100000000 2020000 
በ 900000000 20 512000000000000 00000000000000 
U U U U 0 U D 000 U 

O0O00000000000000000000 

OOO0000000000 28Q0000000000000000000000 
00000000 28000000000000000000000000000000 
OO0000000000000000000000000000000 26000000 
OO00000000000000000000000260000000000000 
םםםםםםםםםםםםהם‎ 28000000000000000 2600000000 
0000000000000000000 20000000000000000000 
5200000000 2800000000000 34000000 260000000 
000 260000000M00000 1280000000000 12800000000 
OO s20000000000000000000000000000000 

በገ U D U D 0 0 0 D 0 0 0 00 DU U D 0 0 U D U 0 0 0 000 U 0 0 0 U D U 
U U U 0 U U 

010000000000 

02000000000000 

U U 0 U D 0000000000000 U DU 0 U DU 0 0 0 0 0 0 U U 0 0 U D U 
በገ U U U D 0 0 0 D U 000000000 00 U 

200000 


0 6260000000000000 struct zone struct D D D D D D 0 D UD D 
U U 
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free area t free areal MX CRFR; 


D [ በ free area t D 00000000 
#ifine MX CFR 10 
type struct free area struct + 
struct list head free list 
unsigned int *nap 
ት free area t 
OO list head D D D 0 D D D D 0 D 0 0 D D D D D D D D 0 D DU መጩጩ t 0 
struct page] 0 O הפא‎ D D 0 D DD 0 0 D 0 DD D DDD በ በ OU free area] [א‎ 
000000000000000 2000000000000000000000 םש‎ 
םםםםםםםםםםםם םםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
םםםםםםםםםם"? םםםםםםםםםםםםםםםםםםםם‎ 69000000 
000000 




















Free area 


mem map t mem map t 


KEES 
56 4 


mem_map_t 











בםםםםםםםםםם 069 


0 6.90 0 free aa D D D D D 00 DD D D D 0 00 DD DD D GO 000 200 
00000 40000000000000000000000000 40000000 
U DD DDD seg 

םםםםםםםםםםהםם ההא םםםםםםםםםםםםםםםםםםםםםם 
በ‏ 520000 בםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
U U 0 UD 000000 U‏ 





632 DO 00000000 


OOO0000000000000000 00000 alloc pages()[] D D OG mx 2. 4 
000000 alloc pages()[] O00 mmm c [] [ D በ በ D nmpage alloc, c [] Ü I] Ú 
בםםםםםםםםםם‎ ₪7 D D D D U 
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םםםםההטאא 1000000000 


ŒG 119811 MM] D D 0 D D D D ^ D D D 0 0 0 D D "O Hm 0 000000 
U U D በበበ በበበ 0 0 NAM በ በበበ D 0 D D 0 0 0 00000000 U 
NM] D D 0 0 0 0 0 D D 0 0 0 0 0 D 0 0000000000000000 0000 U 
םםםםםםטםםםםםםםםםםםםםםםטםםםםםםםםםםםםםם"םםם.‎ 
በበበበበበ םםםםםםםםםםםםםםםםםטםםםםםםםםםםםםטי"םם‎ 


በበበ pg tat 00000000000 mmm c[] በ] alloc page()[] 0 [ 
/* 
* This can be refined. Grrently, tries to do round robin, instead 
* should do concentratic circle search, starting fromcurrent node. 
*/ 
struct page * alloc pages] unsigned int gfp nask, unsigned int order] 
{ 














struct page *ret = 0; 

pg data t *start, *tenp; 
#fndef ONIGNM 

unsi gned 1 ong 11 ags; 

static pg data t “next = 0; 
#endi f 


if [] order >= MX CHER] 
return NII; 
#fdef CNIG NM 
tenp = NE DATA] nma node id] 00; 


Hel se 
spin lock irgsave] 68006 lock, flags] ; 
if [] !next[] next =pgdat list; 
tenp = next; 
next = next- mode next; 
spin unl ock irqrestore[] 6006 lock, flags] : 
Hendi f 
start =tenp; 
while [| Lenn + 
if [ [] ret =alloc pages pgdat[] tenp, gfp nask, order] [] [] 


return] ret[] ; 
tenp = tenp node next; 
} 
tenp = pgdat list; 
while [| tenp != start] + 
if [ [ ret =alloc pages pgdat[] tenp, gfp nask, order] QQ 
return] ret[] ; 
tenp = tenp “node next; 


} 
return] O] ; 
} 
0000000000 
000000000 gp በጩጨመበበበበበበ00010000 order 000000000 


00000 029300 29 
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התה NM‏ בםםםםםםםהההאאא 0000 אאא @NIG‏ 00000 

በ GUD D 0 0 0 pg data LD 0 DD DD D D 0 00 DD D ten) 0 
U D D D D בא םם‎ D D UD 00 pg dta tL 0 በ በ በ በ በ በ podat listUpgdat list 
DOO0000000000000000000000000000000000000 
U uuu 
U U U U D U D 0 0 0 D 0 0 0 0 00 0 U D U 0 U D U 0 0 0 0000 00 0 00 U 
OOO0000000000000000000000000000000000000 
0000000000000 00 DD 00 D alloc pages א‎ [1D 00000 

























































































20 D D 0 00 D (UND D D D 0 0 


0000 האש‎ D alloc page()[] [| incbude/linux/nmh[]| OOOO 
# fndef CNI G O SONIGEM 
static inline struct page * alloc pages[] unsigned int gfp nask unsigned int order[] 
{ 
2 Gets optimized away by the conpiler. 
ae >= MX GER] 
return NIL; 
return alloc pages[] gfp mask, order, 
contig page data. node 200611 815] gfp nask & GP ZONMSK] [] ; 
-— 
ם םםםםםםםם‎ aloc _page()Q alloc pages] 00000000 
-alloc pages] D D D D D D 0 D D D D D] D D D D D D mpage ה‎ 000000 
U U D D 0 D 0 0 U 
_alloc pages] 0000000 םםםםםםםםםםםםםםםםםטה ההא‎ 
NOO000000000000000002**0000000000000000000 
D D D D 0 D DD svapperD םםםםםםםםםםםהםםםםהםהםה ה הפשו‎ 
l| סנוא‎ pages) 0000000 P በ 111010 0000000000000 
DU 0 LD 0 D 0 DD 00000 DDD 00 D WI pod dd 00000000000 
OO00000000000000000000000000000000000000 
OOO0000000000000000000000000000000000000 
U D D 0 D C] U 
U D D 0 D 0 D 0 0 D D D D D D 0 0 D 0 D 0 0 0 D D D U 


* This is the 'heart' of the zoned buddy allocator: 

+ 
struct page * alloc pages] unsignedint gfp nask, unsi gnedint order, 200611 5% t *zonelist[] 
{ 





















































ra Ps EE 











/ 


unsi 0060 1 ong nin; 
zone t **zone, * classzone; 
struct page * page; 
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int freed; 


zone = 200611 st- “zones, 
classzone = *zone; 
nin = 111, <order; 
for O:;0 + 
zone t *z =*[] zoneHf] ; 
if D !z[] 
break; 


nin += 2- >pages_l ow 
if [] 2 34200 pages > mn] + 
page = rnqueue|] z, order[] ; 
if D pagel] 
return page; 
} 
} 
በገ] በበበ በበ 1 በ በ በ]በበበበበበበገበበበበበበገበበበበገበበበበበ[[ 
הםםםםהםםםםםםםםיםםםםםיםםםםםםםםםםםםהם‎ ጨጩመብ[ በ 
በገ1]በበበበበበበ በ D D በበ በበ በበ page DD D D D DE D D D D U D D በ 0 U 


000000 
cl asszone- “need balance = 1; 
nhí] 15 
if [] vai tqueue active] &svapd wit] [] 
wake up interrupti bl ef] Sksvapd vait[] ; 
OO000000000000000000000000 zoet D D 0 D 0 D 0 0 U 
00 DD need bal ag) 1000000000 ה‎ D D 0 DD DDD D HO D 0 0 D 


U 0 D DDD 000 0 0 በ 0 በ በ በ በ በ need bal ance[] በ ksvepd[] DD በ Ú [I| 

zone = 200611 st- 220065; 
mn = 111, <order; 
for [;;0 I 

unsi gned long local nin; 

Zone t *z = %[ zoneHt] ; 

if [] !zl] 

break; 


local nin = z- ages mn; 

if []![] gfp mask א‎ GP WT [] 
local nin == 2; 

mn += local mn; 

if [] 2 +ree pages > mn] + 
page = rnqueuef] z, order[] ; 
if [] pagel 

return page; 


T 


} 
םםיםםםםיםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
| UD D | 400000000 0] z free pages >ninl] 0 C] D. [ D UD D. 0 rnqueve 
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U U 0 U DU U 


/* here ve're in the lowon nenory sl ow path */ 


rebal ance: 
if [] current- flags &[] PF MMIC | PF MMIHI[] 1 
zone = zonel i st- 220065; 
for [;;0 + 
Zone t *z = %[ zoneHt] ; 
if הלה‎ 
break; 


page = rnqueuel| z, order[] ; 
if D page] 
return page; 
} 
return NIL 


} 
א םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ MM 
በ PF MADE D D D task ₪ D D 0 flags בםםםםםםםםםםםםםהםההה‎ 
ksvapd | [| | 0 በ D השא א‎ D D 100000000000 בםםםםםםםא‎ 
םםםםםםםםםםםם‎ P:MMIE[ ዝገ በበበ በበ በበበበበበበበ[በ[በበ 
U U D D 0 0 LUDU 0 D D D 0 0 D 0 Ll 
/* Atomic allocations - ሃይ can't balance anything */ 
if ה‎ ![] gp mask א‎ GP WT] ך‎ 
return NIL; 
በገ] 000000000 DDD D D D D በ ገበበበበበበበበገበበበበበበ[ U 
U "DD" 000 
page = bal ance classzone[] classzone, gfp nask, order, reed] ; 
if D pagel] 
return page; 
በበበበበበበበበበበበበበበበበበበበ መሠጩጠብበበበበ[በበበበበበበበበ 
balance classzon] DD D D 0 0 D 0 D D D 0 0 D D DDD DD DO 0000 0 DD 0 0 
OU page I00000000000000000000 
zone = 200611 st- “zones, 
mn = 111, <order; 
for O;;0 + 
Zone t *z = %[ zoneHt] ; 
if 0 !፲] 
break; 





mn += z- pages mn; 
if [] 2 34200 pages > mn] + 
page = rnqueuef] z, order[] ; 
if D pagel] 
return page; 
} 


} 
U U DUD 0 0 U 
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/* Don't let big-order allocations loop * 
if [] order > 3] 
return NII; 


/* Yield for ksvapd, and try again */ 
current- “policy | = SHED YIELD 
. set current state] TASK RAN NG] ; 
schedul ef] [] ; 
goto rebal ance; 
} 


U U U U D 0] በ በ በ በ rayev በበበ 0 0 0 0 0 በሀበ 0 0 0 0 0 0 U 
[] 10 rngueue] D D] D] 
በገ U በ በ U D 0 0 0 D 0 0 0000000 U 0 0 D U 0 0 0 000 0 00 0 00 U 


t 
static struct page * rnqueue[] zone t *zone, unsigned int order[] 
1 
free area t * area = zone Aree area + order; 
unsigned int curr order = order; 
struct list head *head, *curr; 
unsi gned long fl ags; 
struct page *page; 


spin lock irqsave[] &one- dock, flags[]; 
do 1 

head = &area- >free list; 

curr —nenhist next] head] ; 


if [ curr ! 2 head] 1 
unsi gned int index; 


page =nenhist entry] curr, struct page, list]; 
if [| BAD RANK] zone, page] [] 

BUG] D : 
nemist del] curr] ; 
index = page - zone- zone nemnap; 
if [] curr order ! = MX CHEER 10 

MRK USED] index, curr order, areal] : 
zone- >free_pages - = 111. « order; 


page = expand] zone, page, index, order, curr order, area] ; 
spin unl ock irqrestoref] &zone- > ock, flags] ; 


set page count [] page, 10 ; 

if [| BAD RANGH] zone, page] [] 
BG] D; 

if D Page RJ] pagel [J 
BG] D ; 

if D PageActi ve[] page] [| 
BG] D; 

return page: 
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› 
curr_order-H; 
area; 
} while [] curr order > MX CHER] ; 
spin unl ock irgrestore] &one- ב‎ ock, flags] ; 


return NII; 
} 


0000000000 

20 םםםםםםםםהםההצאא 000000000 DD‏ הפ 00 

do 00 free area] 000 order D 0 0 0 0 0 0 D 0 0 0 0 0 0 pe 0000 
O000000000000000000000000000000000000000 
OOO000000000000000 spiniockirgsave] 0000000000 
OOOO000000000000000000 nemist entry(curr, struct page, 
list) 000000 1000000000000000000000000 BONO OO 
OO Dnemist dl(cur)0 D D D D D D DD D 0 D D D 00 D D D D D DD D D 0 D D D 
OO frea area] NO 0 0 00 0 0 D 0 MK UED DO 0 0 0 0 DI 

P0000 000000000000 expand] ODO 0 0 D 0 D 0 00 DD 0 0 0 0 U 
00000000 
O00000000000000000000000000 
[] 20 expand] OOO 


U U U U D U D 0 U 


static inline struct page * expand [] zone L *zone, struct page *page, 
unsigned long index, int low int high free area L * areal] 




















unsi gned long size = 1 > gh; 


while [] high >1ow] + 
if [ BAD RANK] zone, page] [] 
BGO; 
area-- ; 
hi gh--, 
size == 1; 
nemist add head] &] page] - 3151, & area] - >free list] ; 
MRK USED] index, high areal ; 
index += si ze; 
page += size; 


} 
if [| BAD RANK] zone, page] [| 
BRO: 


return page; 


} 

U U U U D U D ; 

OO zoe D 00 DD D D 0 D 0 DD 00 page 0 0 D D D D D D 0 index [0000 
OOO memmap OOOO 1W]0000000002"00 Kap 00000000 
1100000000 00 2750 area Ù free area ה‎ 0000000000000 
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0000000000000000000000 םםםםםםםםםםםםםם"?‎ 
OOO000000000000000000000000000000000 200000 
D D DD D DD DD order D 980000000000000000000000000 
OOO 800000000000000000000000000000 

page == nem nap+800 

index = 800 

low=1 

high =3 
area = Zone >free areathigh | 000 frea area] ה ה ה הה‎ 30000 
size] 1110100110 (U J size = 1<3 =8) 
בםםםםםםםםםםםםםם‎ ቋመ [OOo DD 0 DDD DD DD DDD U 
00000000 low = n gO D 0 0 D DDD DDD D 0000 D D D 0 
0000000000000000000000 םםםםםםםם"*""?‎ 
-;high-; size ה, ה1=<‎ [] [| | nemist add head] | || 00000 
U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D 0 D D D D D D D D 0 D 0 [0 
00 MR WEN] D D D D D LU 
000000 1000000000 80000000000 40 2* 000 
በ] D D D D 00 frea areal 210 00000000 10wtigi] [000 200000000 
በ 84000000000 200000 frea area U) 00 ü በ በ 0 0 ሀ O page] 808] 
hight ow] 1000000000000000 860000000 20000 

በበበ D D 0 D 0 0 D D D D D D 0 0 D 0 0 U 


A) D D 0 0 


U U U U D U D 0 0 0 D 0 0 D 0 0 D D U D 0 0 U D 0 0 0 0 0 0 0 U D 0 0 U D U 
OO0OO00000000000000000000 free pages(page struct “page, 


unsi gned long order) J000000000000000000000 2*00000: 
void free pages[] page struct *page, unsigned I ong order] 
t 




















9 





o 
o 
o 

E=. E=], AA 

ሀ: ሀ ሠ መ ሀ: ወ CI‏ בם 
בם 
Ë‏ 
8 


9 
፦ 
o 














9 
o 









































if ך‎ ! PageReserved] page] &put page testzero[] page] [] 
. free pages ok] page, order{] ; 
› 


መ page testzero 0000000000000 1‏ בםםםםםםםםםםםם 
OOO 1000000 000000 DD 0000000000000000000000‏ 
OO00000000000000000000000000000 PageReserved] [| [|‏ 
U D PageReserved] D D D 0 0 D 0 D‏ 

OO0000000000000000 free pages() 000 _ free pages ok()[J 
- free pages ok] DD 0 0 D 00 D D D D 0 0 0 DD DD 0 0000 DD D D 0 0 0 0 U 
OO0000000000000000000000000000 estan I 0 0 0 0 D 
በገ [በ U D 00 0000 U 
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6.3.3 Tab[] [] lt 


U U U U D U D 0 0 0 D 0 0 D 0 0 D D U D 0 0 U D 0 0 00 0 00 U DU 0 0 U D U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U DD U D 0 0 ቨ ሀ U 

Dm 2000000000000 130000000000000 32000 132056 
U D D Enx 22000 MD D 0 D 00 DD DD 0 Sal 0000 D D D D በ በ፲ 1994 

































































U D D D D םםם‎ DD Su McrosystemSolaris 2.40 D D D D D Sab] 0 0 0 D D 0 U 
U U U U U 

U U U U D U D 0 0 0 D 0 0 0 0000000 0 U DU 0 0 0 000 0 00 0 00 U 
000 get free page) 0000 0D D D D 0 D 0 00 D D DDD 00000 DD 0 U 
OOO0000000000000000000000000000000000000 
OO00000SeQ000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
00000Se&Q00000000000000000000000000000000 
OO00000000000000000000000000000000 0 
U Sabo DDD 0 0 

U D D D H mes 0 0 הפר‎ 0000 DD DDD DDD 00000 DDD D 0000 U 
אתםםםםםםםםםםםם‎ 0 0 0 D 0 0 0 0 00 D 000 0 0 0 0 D 0 0 00 0 0 U 
U D D D 0 0 0 Hm 0 00 2 abp 00 DD DD 0000 DDD DD 0000 U 

በገ U D U 0 0 0000000 000 U DU 0 U D 00 0 000 0 000 U 














EL E=] E EJ 
ET E=] = r=] 
E-3J Ed; ET EZ 


o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
L1 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
- 
o 
o 
o 
o 
o 
o 
o 
o 
o 



































































































































U U U U D U D 0 0 00 0 000 0 DU U D 0 0 U D U 0 0 0 000 0 00 0 U D U 
በበበበበበበበበ" በ በ 0000000000 DD 000 0 00 0 000 000 U 

NOON DD DD 000 00 0 0 00 D D D D chep D D D0 DDD DUU‏ הפצ 
U U U UD U U D DU U D 0 0 U D U D 0 በ D 0 0 0 D 0 0 0 D U D 0 0 0 D U 0 0 [‏ 
ש[אפםםםיםםםםםםםםםםםםםםםםםםםהםםהפפםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U DU 0 0 U‏ 
D DD DD DDD DDD DDD DDD 000000000 DDD DDD DD D D U‏ 100 6 
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0610 880ቨከ ሀ [ 


OOO000000000000000000000 inode D D D O 3000000000 
הו 80000 בםםםםםםםם‎ D DD D Dinode D 0 0 0 D D D H me D 000 
OO 5200000000000 
OO00000000000000000000000000000000000 Sab] 
OO הפפ‎ DDD 00000 D DDD םםםםםםםםהש‎ 

OO S&OOOOO00000000000000000000000000000 
U uuu 


10 SabQO 000 


Sab 1I0000000000000000000000000 kmemcache tq 00 
OOO 88500 በ kremslab LD NN DD D D D 0 0 0 0 D 0 0 U 

[] 10 Tab 

Sab[ ה‎ DDD DD 000 DD DD 000000 D DDD 00000 DDD U 


misal ab. cD JI UU U‏ םםםםםםםםםםםםםם 
*/ 
slab t‏ * 














* Mnages the objs in a slab. Placed either at the beginning of nemal located 
* for a slab, or allocated froman general cache. 

* Slabs are chained into three list: fully used, partial, fully free slabs. 

*/ 

typedef struct slabs + 


struct list head list; 
unsi gned long col ourof f; 
voi d *s nem /* including colour offset */ 
unsi gned int inuse; /* numof objs active in slab */ 
knembufctl t free; 

} slab t; 


SabQOd0 Sabi IDD D D 0 0 0 D D colowoff‏ בםםםםםםםםםהם 
OO 2abD DDD D D 0 0 DUH s nmn D D 0 D 0 0 D D 1nmse Ù Sab] 00 D D 0 U‏ 
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DU D DD D U Tree D D D D 0 D D 0 D D D 0 D 0 0 D D nmm at ct) םםםםםםםה+‎ 
Sabo םםםםםםה‎ 61000 

ጃመበበበበበ slab tL DDD Sa D DD 0 0 0 000 sag‏ בםםםםמםםם 

OOO00000000000Se&Q00O0000000000 
OO SabN DD DD 000 DDD DDD D 0000" D D D D Gloring Area] " [J 

Sab] 000 DD DDD DON DD DD D D 0" OOOO Gche Li nel”‏ םםםםםםם 

U D DD DD 0 א‎ D D 0 0 0 D D D D D D 16000 Pentium] 200000 Sab 
OO 1000000000000 32000000000 Sabl D 00000 DD D D 0 0 
O000000000000000008eQ0000000000000000000 

0 Se&O000000000000000000000000000000000000 

Sa I00000000000000S9&0Q000000000000000000 

Se&QO00000000000000000000000000000‏ םםםםםםם 

U U 0 U D 0000000000 000 U 









































U U U 0 U 





prev next 


[ 611 Sab00000 


OO S&OOOOOOO000000000000000000000000000 
םםםםםםםםםםםםםםםםהם‎ Sap D DDD 000 DD D DD 0 00000 0 U 
םםםםהשא םםםםםםםםםםםם‎ 
U U U U D U D 0 0 0 D 0 0 000000000 U DU 0 0 0000 0 00 0 DU U 
םםםםםםםםםםםםםםםםנםםםםםםםהם‎ Sa D DD 0 0000 DD 0 U 
U U U በ በ U D 00 U D 0 00 D U 

020000 
םםםםםםםםםם‎ Sab DD SabQ O00 3000 100000 Sa DUD 
U D D 0 ጠበ ረበ Sab) NON DOO 00 DD DD D D 00 DDD ፳መ%በ[ [ በ 
בםםםםםםםםםםםהםםםםהם‎ S&QOOOOO00000000000000 
[ התאו‎ D D D D D D 0 0 0 D D D D D D 0 0 [0 000 knemcache s[] misal ab. c 
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U D D 0 0 D] 
struct knemcache s + 
/* 19 each alloc &free */ 
/* full, partial first, then free */ 


struct list head slabs full; 
struct list head slabs parti al; 
struct list head slabs free; 
unsi gned i nt obj si ze; 
unsi gned i nt flags; /* constant flags */ 
unsi gned i nt rum /* #of objs per slab */ 
spi nl 00% t spi nl ock; 
#fdef (MT G SM 
18151 gned i nt bat chcount ; 


Hendi f 


/* 2] slab additions /renovals */ 
/* order of pgs per slab ][ 2] ሣ 


unsi gned int gf porder; 

/* force GP flags, eg. GP IM */ 

unsi gned i nt of pfl ags; 

size 1 col our; /* cache col ouring range */ 
unsi gned i nt col our_off; /* colour offset */ 

unsi gned i nt col our_next; /* cache col ouring */ 
knemcache t *s] abp cache; 

unsi gned i nt grow ng; 

unsi gned i nt df] ags; /* dynamic flags */ 


/* constructor func */ 
void [] *ctor[] [| void *, knemcache t *, unsigned long] ; 


/* de-constructor func */ 
voi d [] *dtor[] [| void * knemcache t *, unsigned long] ; 


unsi gned | ong fail ures; 

/* 3] cache creation/renoval */ 
char nane[ CACHE, NAMI EN ; 
struct list head next; 


#fdef CONI G SM 
/* 4] per-cpu data */ 
cpucache t *cpudat 8] NR CPUS]; 


Js 

በ UU D በ knemeach tf] D D D 0 0 0 D LU 

static knemcache t cache cache = + 
sl abs full: UST HEAD INT] cache cache. slabs full] , 
slabs partial: 1151 HAD INT] cache cache. sl abs partial[] , 
sl abs free: UST HEAD INT] cache cache. sl abs free] , 
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obj si ze: si zeof[] knemcache t[] , 


flags: SLAB ND REAP, 
spi nl ock: SPIN LOCK UNGIKED 
col our off: 11 CACHE BYTES, 
nane: "knemcache", 

i 

םםםםםםםםם 


00000 3000 slabs full[] slabs partial [] | slabs free] ሀ 00 በ Sab] 
በበ Sabo 00 Sad 00000 םםםםםםםםםםםםהםםהההא‎ 
O000000000000000000000000%bsze)000000000 
U D D DDD D 0 knemcache በ በ] በ በ] mm] በበበ Sabo በ በ በ D በ በ 0 gfporder [| 
OOOO Sab0 0D 0000000 Sabo 2”*000000 
םםםםםםםםםםםםםםםםםםםםםםהם‎ 2ab DD DDD 0 DD 0 DD 
U DDD 0 0 DDD DD DDD D D በ D cd our off D D DD D D [ D colour D D U D D 
םםםםםםםםםםםםםםםה‎ ቋመበበበበበበመጠበበበበ[[በበበ[በበበበበ;[ 
U DD DDD D DDD DDD DD DDD DDD D 0 0 DD 00 color JO 0000 Sab 
U D D DDD DD 0 DD colour next D 0 [] colour next] 0 D 0 D D dB au OOOO 
|1[1[0][1] U התה‎ U [] colour offxcol our] 00000000 colour [| 50 colour off 
l M0000 ቋመበበበበበ ጠቋመበበበበበበበበበበበበበበበበበበ ጩጠበበ[ 
הפב‎ 000000000000 00000 16] 24] 320 0.....0 0 

cache cache] |] 0 DD B. B. B. 0 0 0 0 D LI 0 D 

U D 0 0 D D DD 0 0 D D knemcache t000 Sab] 00 0 DD D D D D D Sab 
000000000 62000 

OC 6.120000000000 ጻጩበበበበበበሀበበበበበበ ቋጩበበበበበ 
OO ቋጩበበበበበበበበበቨበበበበበበጃቋመበበበበበበበበበበበ[በ[በበበበ[ 
םםםםםםםםםםםםםםםםהם‎ Sab000000 


2J00000000000 
U D D D D 0 00 knemcache create] 0000000000000 


knemcache t *knemcache create] const char *nane, size t size, size t offset, 
unsi gned 1 ong c flags, 
void [] *ctor[] [ void *objp, knemcache t *cachep, unsigned long flags[], 
void [] *dtor[] [ void *objp, knemcache t *cachep, unsi gned long flags[] [| 
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Slab [] [] 





vi 


Slab [] [] « ር | Slab [ 0 4 
ው 8000 ው 8900 


UU ሀ ከ‏ הז ה knemcache tf] Sabi]‏ 00000 612 ם 


U U U U D U D 0 U 

U 19 vane] OOOO (1900000 

0 size] 00000 
0 3] offset םםםםםםםםםהה‎ 
040cflag D 0000 DDD 00 0 

. SLAB H/ACFE הא‎ በበ D D D D 0 0 D D D D በሀበ 160 2000000 








。 SLAB NO ADT D 0 EL D DD U 00 0 

° SAB OCE Mg D 0 S abi 000 M00 

0 50 cto 0000000000 NIIT 

0 6] tor םםםםםםםםהה‎ NOG 
በ ሻሽ bjp 000000000 
[] 8] cacep J 1 D D 1 D D] 

OO00000000000000 

knemcache create] ] D 0 D 0 0 1111111010 100000 Sabi D 0 D 00 0 

0 םםםםהםםםםםםםהםהההההפפ‎ SabQ 0000 slab t 0 O00 Sabi] o0 











00000 GO OOO000" 00” O0000000000000000000 
knemcache t D 0 D D D 0 0 D D D D D D D D D cto 0 do] DD | | knemcache t 
00000 cache cache] next [] O00 
U D D D DD D knemcache creat] DD 00000000000000 Sab" D D 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ Sab] 

0000000000000000 

0200000000000000 

O00000000009e&0Q00000 knemcache grow (1 (1 D D D D D D 
OOOO Seg) D DD D D DD knemgatepagessOO 0000000000000000 

















- 201 - 








[| | Linux | ul 


knem cache sl abgnt() D OO D 0 Sab] 0 [T] [] [] [| knemcache init ዐቫ s()[ [| Slab 
םםםםנםםםםםםםםםםםם‎ በ በ OI በ OÙ [| knemslab link end) 00 Sab 
םםםםםםםםם‎ ቋመበበበበ[በ 
בםםםםםםהםםםםםםםםםםםםםםםםםםםםםםםםםםםהה הפב‎ 
000 Dnes D DD DD DD DDD DDD D 0 מםםםםםםםםםםםםםםהםההתא‎ 
O00 vmarea struct} [| [] [] [| [] HH [] vmarea ር8ርከ6፲] 
vmarea cachep = knemcache create[] "vmarea struct", 
sizeof] struct vmarea struct] , 0 
SLAB HCE AOU Q NIL NII] ; 
በበ 111 በበበበበበበበበበ NU DDD 000000 DDD DD Sal 0 0 [ 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 
בםםםםםםםםםםםםםםםםםםם‎ nt/core/ buff.c D 0 l 
void init skbinit] void] 
{ 
int i; 
skbuff head cache = knemcache create] "skbuff head cache", 
sizeof] struct sk buff] , 
0, 
SLAB HAGE ALT GY 
skb headerinit, እ1፲1!] ; 















































if [] !skbuff head cache[| 
panic] "cannot create skbuff cache"[] ; 


for i=0; i ÅR CU ig 

skb queue head init] &kb head ህ001[11. 1151[] ; 

› 

D D D D D ם‎ D D D skbinith D D D knemcache create] ] D D D 0 D D 0 0 D L 
sk buff D D D D D D D D 0 D D 0 D D D “ skbuff head cache”) 00000000 
proc/slabinfo NO D D D D D D D 0 D UD D D 0 offset | OD DDD Sab 
OOO000000000000 flags] SLAB MATE AIN] OO Sab] D D D 0 Ú 
םםםםםםםםםםםםםםםםםםםםםם‎ skb headerinit(] [T] 0 D D 0 D D 0 0 
םםםםםםםםםםםםםםםםהפ םםםםםםםםםם‎ 
U U D 0 D 0 0 D D 0 D 0 D 0 D D 0 D 0 D 0 D 0 0 0 0 0 D D D D 0 D 0 D 0 0 U 
00000 knemcache destroyOOO 000000 Domm 2.4160000000000 
U U D 0 D 0 D D D D D በ D በ 


A) D D 00 U 


በገ U D U D 0 0 0 D 0 0 00000000 0 UD U D U 0 000 00 0 0 DU U 
םםםםםםםםםםםםםםםםםם‎ 32900000 641 129] ...... OO 128፻፻] D 32 
םםםםםםםםםםםםםםםםםםםםהם‎ S&QOQOO00000000000 


0000000 
voi d *knalloc] size t size, int flags] : 
Void kree] const void *obj pi] ; 


EJ 
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U U U U D U 0 00000000 000 U D U 0 U D U 0 0 0 000 000 0 00 U 
U D D DD 000 DD DD 0 0 םםםםםםםםםםםםםםםםםםםםהה וא‎ 
OOOO aloc መመ()10በ[0በ00[ በ D D ከ 
O0O000000000000000000000000000000000000 
በበ1በ0በ[በ00900ሀ00 00000 00 በ םםםםםםםםםטםםםםםםה וא‎ 
U D DD D DD Dm 2.00 000000000 םםםםםםםםםםםםםםהטסואא‎ 
OOO000000000000000000000000000 





















































םםםםםםםםםםההם 634 


O00000000QGV000000000000000000000000000 
000 Dn DDD D D D 00000 DD D 8000000000000000000 
U U U U U 

4B000000000000000 6138000‏ 380 םםםםםםםםםם 


high_memory 
PAGE_OFFSET | VMALLOC_START VMALLOC START 
































0 613 Q PXE GFSET LL HH LB D. D UU 


PAE GFSET ] 3G8] high nenory O D D 0 D 0 D D D D D D D 0‏ ][ ][ 6.13 ם 
VMLLOC START D D D] 0 D D 0 0 0 0 U 0 በ D include] i386 potab e. h[] [|‏ 
#define VMIICC CFFSET [] 8*1024*10241]‏ 
#define VMLLCC START QQ [] unsigned long] high nenory + 2*VMLLOC CFFSFI- 1] &\~‏ 
VMLLOC CFFSEF 10 0‏ 0 
8M] MLG osem N0000‏ םםםםםםםםםםםםםםםםםםםםםם 
000000000 000000000000000 000000000000700 
4BON 0 0 DD 000 D 0 DD D DD D D D D 490000‏ םםםםםםםםםםהם 


םםםםםםםםםת 
ሀ [| struct vmstruct[] NO | incl ude/1i nux/ vnal l oc. h[] []‏ |[ הת 1 1 U U U U‏ 


struct vmstruct + 
unsi gned 1 ong flags; 
void * addr; 
unsi 0060 1 ong si ze; 
struct vmstruct * next; 





E 


struct vmstruct * vnhist; 
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vist DU Addr JOD‏ םםםםםםםםםםםםםםםםםםםםםםםםםםם 
size D D 0 0 DD 0 40000000‏ םםםםםםםם 


2J00000000000 


በ] D get vmarea 1 0 D D 0 0 0 D 0 D D D 0 0 D D D D mávnall oc. c [| [| 
struct vmstruct * get vmarea[] unsigned long size, unsi 0060 1 ong flags] 


























unsi gned long addr; 
struct vmstruct **p, *tnp, *area; 


area =[] struct vmstruct *[] knalloc] sizeof] *area[] , GP KERNHI]| ; 
if [] ! areal] 
return NII; 
size += PRE SIZE 
addr = V IGC START; 
wite lock] Smhist lock] ; 
for [| p =&mist; [ tnp = | ; p =&np net] 1 
if QQ size +addr < addr] 
goto out; 
if [| size + addr <= [|] unsigned long] tnp- addr] 
break; 
addr =tnp 5126 ተ [] unsigned long] tnp- >addr; 
if [] addr > VMIIOC END si ze[] 
goto out; 





} 

area- flags = flags; 

area- “addr —[] void *[] addr; 
area- 25120 = size; 

area- “next = *p; 

*p = area; 

wite unlock] &nhist lock]; 
return area; 


out: 
wite unl ock] &mhist_lock] ; 
kfred] area] ; 
return NII; 
} 


0000000000000000000000000000 kmlloc()[] kfree() 
00.00000 ג‎ 0 i] 0 0 0 0 0 0 0 0 0 0 0 utu 


םםםםםםםםתת 


D D 0 D 0 B D D BH D D 000 0 D በ D /incl ude/1i nux/vnalloc.h [] []‏ הסוא 


U U D U 
static inline void * vnalloc [] unsigned long 51281] 


return vnalloc[] size, ŒP KERNEL | GP HGMM PAE KER; 
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ህ፲፳110ር1] 0000000 val loc J 0 0 D D D D D D D DU 6.60 
void *  vnalloc [] unsigned long size, int gfp nask, pgprot t prot] 
1 














void * addr; 
struct vmstruct *area; 


size = PAE NIN] size] ; 
if [ !size | | [] size >> PAE SHFI] > numphyspages[] + 
BRO; 
return NII; 
} 
area = get vmarea[] size, VMALLOT ; 
if [] ! areal] 
return NIL; 
addr = area- “addr: 
if [] vnalloc area pages] VMLLOC VMIIR] addr] , size, gfp nask, prot] | 1 
vfree] addr] ; 
return NII; 
} 
return addr; 
} 
በበበበበ size በበበበበበ በ በበበ א‎ DDD 0 DD DDD DDD D D 0 D 
U D DD D D D D D D D D 0 D 0 D D D D D D D D D D D በ በ get vmarea] በ በ | U 
U D DDD DDD DDD DDD DD D D D 0 0 D vnalloc area pages] D 0 0 0 0 D D D 
uu 
inline int vnalloc area pages [] unsigned long address, unsigned long size, 
int gfp mask, pgprot t prot[] 


pgd t * dir; 
unsi gned 1 ong end = address + si ze; 
int ret; 


dir — pgd offset HI address] ; 
spin lock] &nit nmpage table lock] ; 
do + 
pna t “pna, 


pnd = pnd alloc] &nit nm dir, address] ; 
ret =-ENMM 
if [] ![:ጣ] 

break; 


ret = - ENOMEM 
if [] alloc area pnd] pnd, address, end - address, gfp nask, prot] ך‎ 
break; 


address = [] address + PAAR SZH] & PAIR MSKK 
dir++ 


ret = 0 
} while [] address &&[] address <end] [] ; 
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spin unlock] ëmt nmpage table I ock] ; 
return ret; 


} 

U D D D D 0 0 በበ [0 በ address D D D D D 0 0 0 00 D size D D D 0000 U 
םםםםםםםםםםםםםםהם‎ endi DD 00000 DD DD 0000 U 

በ 19 pgd offset ה‎ DD D D 0 D 000 DD DDD 00000 DD D U 

U 29 pad allo] DD DD 0 D 00 DD DD 000 D U 

alloc_area pn NA D DD D D 0 D 0 0 0 D D D D D D 0 D 00 DD D D 0 0‏ ]3 ם 
pte alloc kernel ON 0 0 0 D DD D D D D 0 0 D D D በ ₪106 area pre] [J‏ 00000 
በገ በ በ 0 U D 000000 U‏ 

O 4] D vnalloc area pages] D 0 0 D 0 DD D 0 0 0 D DD D D 0 D 0 0 0 0 D 0 U 
U U U U DU U 


ብ] knalloc()[] vnalloc()Q [] [| 


10607 vnalloc() DDD 000 DDD DD D D 000 DD DDD D 0 000 U 
U U U U DU U 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 344 44 D 0 
በ D በ kallo0] D 0 ] D በ፲ 368] high nenory D D D D vælle00 00000 
WLR ዲላ ה‎ D DD D D 0 0 D D 0 0 00 0 D D D 0 0 0 D D 0 0 D ON knalloc() 
U 0 D D DDD D DD 0 0 םבםםםםםםםםםםםםםםםםםהטושט‎ ፤/9ቨ0 በበ 


U D D DD D DDD DDD D [በ በ በ በ [በ በ include/asmi 386/ nodul e. hOOOOOUOU000 
#defi ne nodule nap] x[] vnal I oc[] xf] 


U U U U D U 0 0 0 U D 0 0 00000 U 
[] kmalloc()[] 11060 D D D 0 0 D 0 0 D D 0 D 0 kfree()Q vree 0 


L1 


























64 በ1[[0[ [ከ 


በገ U D U D 0 0 0 D 0 0 0 0000 U DU 0 U DU 0 0 0 00 0 0 D 0 0 U U U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 
0 ה63‎ D DU 0 DDD DD DD 000 DD DDD D 00 DD DDD 00000 DD 0 U 
םםםםםםםםםםם‎ 6.5000 
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U U U U U U 





0614 0000000000 


641 0000000000 


Pagg] 0000‏ 0000 ה 0 Mode) D D D D‏ םםםםםםםםםםםםםםםם 
free area] D DD D 0 0 D 00 D D D D 0 0 0 000 D DDD 00000 DD D D 0 0‏ 0 
U U U UD U U D 0 0 0 D U 0 0 0000000 NON D U 0 U D U DU 0 U D 0 0 0 U‏ 
םםםםםםםםםםםםיםםםםיםםםםם 
U U U U D U D 0 0 0 D 0 0 0 0 D 0 0 D D U D 0 0 U D 0 0 0 OD በ U rmstruct[]‏ 
D 0 U D 0 0 0 D በ 0 d D‏ ה structs[]] 0 000 mmstruct‏ המ U U U በ ሀ በ D U‏ 
U U U U በ በ ሀ በ D በ vmarea trut D D 0 0 D U 0 0 0 0 0 0 0 UU 0 0 በ [ሀ ሀ ፲]‏ 







































































19 MASTRECTT] O 
nmstrcut םהה‎ D D 0 D D D D D D D በ D D በ /incbude/1i nux/ sched. h OOOO 
U U 
struct nmstruct + 
struct vmarea struct * nmap; ההשצטםהםםהםםםהב*!‎ * 
rb root t nmrb, U ኝ] 0 red hack] */ 
struct vmarea struct * nmap cache; *O0000000000% 
pgd t * pgd; በሚግበበበበበ10[00ሣ 
atomic_t nmusers; /ፆ ገገ በ ገበ በበበበበበ” 
atomic t nmcount; /* D "struct mmstruct"[] [] 00 [] */ 
int nap count; *אםםםםםםם*!‎ 
struct rwsenaphore nmap sem 
spi nl ock t page table lock: /*0000000 ma— ss */ 
struct list head mist; /*0 0000 active] mm] 00 * 








unsigned long start code, end code, start data, end data; 
unsigned long start brk, brk, start stack 

unsigned long arg start, arg end, env start, env end; 
unsigned long rss, total vm locked vm 
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unsi gned long def flags; 
unsi gned 1 ong cpu vmnask; 
unsi gned ] ong svap address; 


unsi gned dunpabl 6: 1; 


/* Archi tecture- specific MMcontext */ 

mmcontext t context; 
y 
በገ [1 111[00 [0 D U 
በ በበን በ | በበ በ D D D በ በበበ በ D [| ₪ 
00000000 הפו‎ D D DD 0 D D task struct D DD 0 D DD d D D 
U D D U ገ 0 በ ሀ D በ mastruct D D D 0 0 D 0.0 D D D D 0 U 
በበበ በ በ በ በ በ በ በ በ 0 0 D D D D D ሀ 1 በ 1 D vmarea struct [0000 
በ ቨ ገበ በ በበበ በበ 1111 በ በ D D በ ገ በ ep 00000000 
*םםםםםםםםם‎ 0000 red blacktree] " OOOO mrb DD DD DD 2.410 
םםםםםםםםםםם‎ ALD D DDD ALD 00000000 D D D 00000 L 
በ በበን በ | በ በ በበ በበ በ በ በ በ በ በበ በበ በበ በበ በበ በበ በ 0 D 0.0 D D D D 0 00 0 በ 
በበ በበበ በበበ D D D DU D D 0 0 0 0 00000000 DDD D D D D D U 
map cache [| [] [| 


OO ped HD 0 0 





























U U U ገበ U D 0 0 U D 0 በበ ጠበበ 0 U D U D 0 0 U 
O0000000000000000000000000000000000000QG0 
O0O00000000000000000000000000000000000 
በበበበበበዐበበበበበንበሀበበበበ FOVOOOOOO map seni DOC 
[] 

[] 

[] 





page table lock] 000000000000 
U U U U D U D 0 0 0 D 0 0 00000 U DU 0 U DU D U 0 U D 0 0 0 0000 U 
U U D D U 0 0 0 0 0 D D D 0 0 0 mmstruct D D D D D D D D nmuser [| nmcount 
םםיםםיםםםםםטםםםםםםםםםםםםהםהה:6א םםםםםםם‎ 

U U U U D U D 0 0 U D 0 0 0 0000000 0 0 D U D U U U D U 0 0 0 000 U 
U U U UD 111111. 0 D 0 1111 0 0 0000000 00 0 U D U 111111] 

nmcontext L D D D D D D D D 0 0 0 0 በ i386 00000 
O0O00000000000000000000 


2] VMAREA STRUCT [] |] 





















































vmarea struct [] 0000000000000 [0 /include/li nux/ nmh T] 0 D] U D U 
struct vmarea struct 

struct nmstruct * vmnm *םםםםםםםםםםם*!‎ 

1051 0060 long vmstart; /* 0 ጩጨጩብ[[በበበበ[” 

unsi gned 1 ong vmend; /*U wami 00000 */ 


/* linked list of VMareas per task, sorted by address */ 
struct vmarea struct *vmnext; 
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pgprot_t vmpage prot; ፆሥበበበበገበበበበበበበ ሣ 
10051 0060 1 ong vmfl ags; /* 0000000 v 

rb node t vmrb; 

/* 


* For areas wth an address space and backing store, 

* one of the address space- 3 nmap{, shared} lists, 

* for shmareas, the list of attaches, otherwse unused. 
*/ 

struct vmarea struct *vmnext_share; 

struct vmarea struct **vmpprev share; 


ID D D D 00000000 v 
struct vmoperations struct * vmops; 





/* Infornation about our backing store: */ 































































































































































































unsi gned ] ong vmpgoff; /* Œfset [] wthin vmfile[] in PAE SIZE 
units, *not* PAGE CACHE SIZE */ 
struct file * vmfile /* Hle ve nap to [] can be NII]. */ 
unsi gned | ong vmraend; /* XXX: put full readahead info here. */ 
void * vmprivate data; /* vas vmpte [] shared nen */ 
E 
vmflag] 1በ1]11101101010101010001010000000 61000 
[ 61 םםםםםםם‎ 
U በ] U ה ה‎ 
VMTENWR TE U D 0 0000000000000000 0 
VMEXEC 000000 
VMEXHOTABLE 00000000 
WOH SON 000000000000 
MGOBUP םםםםםםםםםםםה‎ 
WIO OO0000000001/00000 
WMLOKED D0000000000 
WMMYEXEC חםהםהה השא‎ 
VMMYREAD VMREAD D [J E] DN 00 
VMMYSHARE MSMEIOOOOOO 
VWMMYW TE VWMWUIE [] DH 0. 00 ሀ 
VMREAD 00000 
VMSEARED D000000000 
VMSIM OOO tho000 
WMW TE 00000 
0000000 vmarea ₪ NP 0 D 0 D D D DD D D 0 D D 0000000 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 
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በበ1]በበበበበበበበበበበበበበበበገበገነበበበበበበበበበበበበበ; 
በበበበበበበ ገበ በበ! 000000 vmarea strut [] 0000000000 
በበበ DDD DDD DDD D םםםםםםםהההםםםהםההה אע‎ 
U vmops[] D D D 0 0 0 1 D D D D D D በ ገበ D D D D D D 0 D D D 0 0 U 
DH mD D DD D DDD DDD 0 DD DDD DD 0 D D 0 D 0 D D D D D ክዉቿዉ 
U 0 D D D D D D D D D በ፲ በ በ vmopeation s-stract ] D 0 D D D D D D D D U U 
הח |[ |[ ם‎ include] linux] nmh[] [] 
/* 
* These are the virtual MMfunctions - opening of an area, closing and 
* unnappi ng it [] needed to keep files on disk up-to-date etc] , pointer 
* to the functions called when a no- page or a wp- page excepti on occurs. 
Tj 
struct vmoperations struct 1 
voi d [] *open{] [] struct vmarea struct * areal ; 
voi d [] #cl 05ሟ] [] struct vmarea struct * areal] : 
struct page * [] *nopage[] [] struct vmarea struct * area, unsi 0060] ong address, int unused] ; 
E 















































o9 
o 


vmoperati ons 000000000000000 open] close 0000000000 
U 1[] ፲ DU ה‎ 0000 D 000 0 0 DDD 0 0 0" OOOO" 00 D D 0 0 0 U 
OOO 635000000000000 


vm_area_struct 0000000 


— 
000000 


300000 


ber dl 
H nm 00 2.4 10 D DD DD 0 D DD D 000 D םםםםםםםםםהםהא‎ 
በበበገበበበ በበበ ALD በበ ገበበበበበበበበሀበ D 000 DD 00 D 00 0 
U U U U D 0 U DU 0 D U 0 U D 0 0 D በ በ 
U U U 0 00 0 00 0 U D 0 0 D 0 0 
םםםםםםםהםםםםהםםהםםהםהם.‎ 
e UU UU UU U 
e םםםםםםםטםםטהםםםםםהםםהםםהםהם‎ 
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0000000 
open() 

close() 
nopage() 










06.1 0000000000 
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e פםםםםםםםםםםםםםםםהםםםםםםםםםםםםם‎ 
0 61600000000 




















0616 00000 


[| U U U U ה ה‎ include/linux/rbtree. h[] [] 0000 
typedef struct rb node 5 
t 
struct rb node s * rb parent; 
int rb color; 
#define RB RED 0 
define RB BÆK 1 
struct rb node s * rb right; 
struct rb node 5 * rb left; 
} rb node t; 


642 0000000 


SGQOOOO00000000000000000000‏ בםםםםםםםםםם 
3G00000000000000000000000000000000000000‏ 
U U U U 0 U D 000 U‏ 
38Q0000000000000000000000‏ םםםםםםםםהםםםםם 
œs DDD OD DD DD dp‏ בהא OOO0000000000000000000‏ 
OOO00000000000000000000000000000000 static] 00‏ 
O0O0000000000000000000000000000000000000‏ 
OOO0000000000000000000000000000000000000‏ 
0617000 












































- 211 - 















































Ul Linux [ [] [ 



































D ud 38] 

































































በገ U D U D 00 0000 U 















































U U D D በ D nmstruct [1D 0 D [] 
O00000 vmarea struct MO 













































































U U 0 U D U 000000000 U 
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Task_struct 


U U 0 0000 U 























U U 
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U U U U 


mm_struct vm area, struct 


vm end 
vm start 
vm_flags 

vm_inode 


vm ops 


mmap_sem vm_next 


vm area, struct 


vm_flags 

vm_inode 
vm_ops 
vm_next 


םםםםםםםםה 618 ם 


ה[אמטםםםהםםםהםםםהואתא vmarea‏ בםםםםםםםםםםםםםםםםם 
U U 0 U D 00 በበበ በበ DU 0 D 0 U D 0 0 U D U D 0 0 0 D 0 0 0 0 0 በ በ ከሀ ሀ በ‏ 
vmarea struct D 0 0 0 0 D D 0 0 0 0 0 D D 0 D D 0 0 0 D 0 D D 0 DU Ti mx [] U‏ 
D 0 0 D D D D D H ne 0 00 UD Ú‏ ה U D D D Rd black] D OO” vmarea‏ 





0000 


mem map 


000000 





U U 
0x8059BB 





DO 
0x104800 


0x000000 











U DDD DDD DDD DDD D 0 D D אע‎ 0 D D D 0 D vmarea struct OOOO 
በበበበበበበበበበበበበሀሀሀበበበበበበበሀበበበበበበበበ 60800000 
O00000000000000000000000000000000000000 
U 10 0 Eng JO000000000000000000000000000000 
O0000000000000000000000000000000000000 
000000 væ area struct [] | IMO ם‎ find א‎ [T] J D D D D በ በ በ በ mnmap.c 


* Look up the first VM wich satisfies addr «vmend, NIL if none. */ 
struct vmarea struct * find vna[] struct nmstruct * nm unsigned long addr] 


{ 


struct vmarea struct *vna = NIL; 
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U U U 
U U U U U 


U U U U U 
U U UU U 















































Ul Linux | ul 














if በ] መከ + 
/* Check the cache first. */ 
/* D Gche hit rate is typically around 35%[ */ 
vna = nm map cache; 
if [] ![] vna S&&vna- >vmend > addr S&vna--vmstart «-addr[][] 1 
rb node t * rb node; 


rb node = nm->nmrb. rb node; 
va = NIL; 


while [ rb node] + 
struct vmarea struct * vna tnp; 


vna tnp =rb entry] rb node, struct vmarea struct, vmrb] ; 


if [| vna tnp mend > addr] + 
vna = vna tnp 
if J vna tnp- vmstart <= addr] 
break; 
rb node = rb node- =b left; 
} else 
rb node = rb node- >rb ri ght; 


if J vag 


nm-nmap cache — vna; 


U U 00 1009010000 D 0 D D מםםםםםםםםםםהםנהאאש‎ 
O0O00000000000000000000000 


OOO00000000000000000000000000000000000 


mmstrut D D D D D nmap cache [|] D [J‏ 300000 םםםםם םםםםם 
םתבהא םםםםםםםםםםםםםםםםםםםםםם 





















































םםםםםםםםםםםםה השספםםםםםםםםםםםםםםםםםם 
U DDD 000 D D D 0 DD D D D man cache 00000000000‏ 








vmarea struct [] [] [] 





በገ] በበበ በበበ በበበ በበበ በበበ በበበ U DU D 0 0 0 D 0 0 0 0 0 0 U 


OOO insert vmstrutO] D D D D 0 D 0 D vmstruct D 0 0 000 D D 0 U 


U U 


643 OOOO 
U U U U D U D 0 0 0 D 0 0 0 0 0 D 0 U D 0 0 U D U 0 0 0 0000 00 0 U UD 


U U U U U 
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U U 000000 00000 DD 000 0 00 D D 00 0 0 D 0 0 0 0 U nu 








U U U U 
U U U U 














D uuu 


בםםםםםםםםםםםםםםםםםםםםםםםםםםםםהההאתם 000 


OO do 
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OOO0000000000000000000000000000000 
OOO0000000000000000000000000000000 








OOOO0O00000000000000000 vmarea struct 7 
U U U U D U D በ vamarea strut D U D D D U D 0 0 0 0 uut 
םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ do nrap)l 
J vmarea strut ה‎ | 0 0 0 0 0 0 0 D 0 D 0 D U D 0 0 0 0 U bul 













































































םםםםםםםם 

OOO0000000000000000 do ה(‎ D D 0 D U 

map 10 D D D D D D D D 0 00 DD D DD 00000 DD D D 000 0 U 
U D 0 0 D 0 DD D 0 D D 0 Odo map()[ incl ude/linux/nmh D] (] D 00 





static inline unsigned long do nmap] struct file *file, unsigned long addr, 


out: 


} 
U U U U 
file] 0 


unsi 0060 long len, unsigned long prot, 
unsi 0060 long flag, unsigned long offset] 


unsi 0060 long ret =-H NAL; 
if 00 offset + PME ALIGN] len] | > offset[] 
goto out; 
if [ ![] offset & -PACE MSK] D 
ret = do nmap pgoff[] file, addr, len, prot, flag offset >> PAE SHFI] ; 


return ret; 


U U U U DU U 
በበ1በበ[በ0088180በ00[0000000000000[ቨ 


offset (I በበበ በበበ በበበበበበበበበበበበበበበበበበበበበ[በበ[በበ[ቨ 


U U U 0 0 U 


םםםםםםםםםםםה+הפסהם 


lem D D D D 0 000 DD 0 D 





addr[] D 
prot: [] 
PROT WW TH] 
utt 
flag] [] 


U U U U 











U U U U 


U U U U D U D 0 0 0 0 000000 000 U DU 0 U D U [ U U 
OOO0000000000000000000000000 PROF READ] 
PRI 5811 PROF NN 0 3000000 RND WMWTIE [| VMEXEC 
PRO NN] D D D 0 D 00 3000000000000 

በገ በ 0 U D 00 0000 U 





MP CRO/SDOM MP LOCKED] MP DEM TE[] MP EXBATAHE [] 


በበበ 61000000000000 


MP SARDO MP PRIVATE [] 


በገ U D U D 0 0 0 D 0 0 00000 0 D U 0 0 0 U 00 0 00 0 U D U 


O00 vmarea struct [| [| VMSHARED|] [1 [| 


0000 





U U U U 


MP ANNYMIS 


በገ U D U D 0 0 U D 0 000 U 


MP FIXED 


U D D DD 00000 D add D D D D U 
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MP NCRESERVE 
מםםםםםםםהםםםהםםםם‎ 
do nmap) [] D 00 offset םהה‎ 0 [|| | [| [| [| D do map poff] [00000 
U D 0 0 D 0 DD 00 [በ በ በ do nmap poff] D D D በ በ בםםםםםהםההה השש‎ 


U D D D 0 U 
unsi gned long do nmap pgoff[] struct file * file, unsigned long addr, unsigned long len, 
unsi gned long prot, unsigned long flags, unsigned long pgoff[] 





{ 
struct nmstruct * nm- current- nm 
struct vmarea struct * vm, * prev; 
unsigned int vmfl ags; 
int correct wount = 6; 
int error; 
rb node t ** rb link, * rb parent; 


if [] file &Q !file-4 op || !file->f_op- map] 0 
return - ENTEV; 


if ך ה‎ len = PXE AUTO len] | = OJ 
return addr; 


if [] len > TASK IZH] 
return -H NAL 


/* offset overflow */ 
if 00 pgoff +] len > PAE SH PI" 0 < pgoff[] 
return -E NAL 


/ቾ Too nany nappi ngs? */ 
if [] nm >nap count > MX MP CON] 
return - ENMM 
በገ1]በበበበ በበበ በ በገበበበበገበበበገበገበበበበበበበበገገበበበበበ[ 


U D D DD do mant 10 D U U 0 0 0 0 0 D D 0 DU 
/* Qotain the address to nap to. ve verify [] or select] it and ensure 
* that it represents a valid section of the address space. 
*/ 
addr = get unnapped areal] file, addr, len, pgoff, flags] ; 
if J addr ₪ DND MSK] 
return addr; 


OO get unnapped area] D D D D 0 0 0 DD D D D 0 0 0 0 0 D D D D 0 0 0 0 0 
በ D 0 PACE MSKI ה‎ [| OxFFFFFOQQ] O D OO በ" addr 8f] PAGE እጩ ה‎ 000 0 addr 
OO 200 = D D D D D D 0 0 0 0 DD D D 0 D 0 00 ade n 


ጋበበመጩመበ[በበበበ[በ‏ םםםםםםםםםם 
/ች Do sinple checking here so the lover-level routines won't have‏ 
to. we assune access permissions have been handled by the open‏ * 
of the nenory object, so ve don't do any here.‏ * 
/* 
vmflags =cal ር vmf] agg] prot, flags] | mm>def flags | VMMYREAD| VMMYVAR TE| VMMYEXEG‏ 
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/* mock ML FUTURE? */ 
if [] vmflags & VMICKH)] + 
unsi gned | ong locked = nm 4 ocked vm << PACE SH FT; 
locked += len; 
if [] locked > current- >liniR IMT MEME]. rl i mcur[] 
return - ECAIN 
› 


በበ fag000000000000000000000000000000000 
OOOO task struct 0 0 rliniRIMT MMOXK.rlimcw D D 0 D 000 D 00 0 0 0 


00000 
if [file] + 
switch |] flags SMP TYPE] + 
case MP SAED 
if [] [] prot &PRO WTH] &&![] file node & FMIE VÆ TE] [] 
return - FACES; 


/* Mke sure ve don't allowwiting to an append only file.. */ 
if [] IS APPENJ] file--£ dentry->d inode] &&[ file node & FME WITH] |] 
return - FACES 


/* make sure there are no nandatory locks on the file. */ 
if [] locks verify locked] file >f_dentry- + i node] [] 
return - ANANN 


vmflags | = VMSHARED | VM MYSHNRE 
if 0 10 file # node & FME WH] 0 
vmflags ፎ +] VMMYVRITE | VMSHARED ; 


/* fall through */ 
case MP PR VATE: 
if [] ![] file 2 node & FMIE RAD] [] 
return - FACES; 
break; 


default: 
return -E NAL 
› 
} else + 
vmflags |= VMSHARED | VMMYSFARE 
swtch |] flags & MP TYPE] + 
default: 
return -H NAL 
case MP PRIVATE: 
vmflags & 4] VMSHARED | VMMYSENRH] ; 
/* fall through */ 
case MP SAED 
break: 
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በበ file DD DD ጠበበበበበበበበበበበበ[በበበበበበበበበበበበ[በ[[[ 
በበ file] [0000 OOOO0000000000000000000000000 
U U D D 0 0 D 0000000000000 
U D DD 0 0 D 0 D 0 00 D DD D D D D D 0 D 0 D D D D D D 0 D D 0 0 0 D 0 U 
U U D D 0 0 0 D D D 0 0 DD DD D D D DD D በ በ 
U D DD 0 0 D 0 D 0 D 0 D DD D D D DD 0 0 D D D 0 0 D U 
U D DD 0 0 D 0 000000000000 
/* Gear old naps */ 

error = - ENMM 
nunnap back: 
vna —find vna prepare] nm addr, &prev, & blink &b parent] ; 
if [] vna SS vna- Wmstart <addr +len] + 

if [] do numnap] nm addr, len] [] 

return - PM MEM 
goto nunnap back; 



























































} 

OO find vna prepare] DQ find wa] D D 00 D D D D D 0 D 0 D 0 0 0 D U 
vmarea struct ה‎ D D D D D D D 0 0 0 0 D D D D HDD 0 הה=‎ 10000000 
U D D DD 0 0 DD addr D D D 0 00 000 DD DD 00 DD DD D D D 00 DD 0 U 
do ₪ DD D D D D D D D 0 D 00 D D D D 0 0 00 D D D D 0 0 DD D D 0 0 0 0 D 


edarr D D D D D 00 0 0 0 0 D 00‏ םםםםםםםםםנםםםםםנםםםםםםהם 
Check against address space limt. */‏ */ 
if [ 0 nmastotal vm >> PAH SH PIH +len‏ 
current- “rl inf RI MT AS]. rlimcur[]‏ > 
return - EN MEM‏ 
I00000000000000000000000000000000‏ ו total‏ 
התםהםהההההההההה ה D000000000 ፲11፲8፲፪1እ፪ፐ ASI.rlimcr‏ 
Private writable napping? Check nenory availability.. */‏ */ 
if 00 vmflags &] WMSHRED | VMVWATH] [| — MWTE &‏ 
I flags & MP NCRESFRVA] S&vmenough nenory] len >> PAE SH PI []‏ 
return -ENMM‏ 
D D D D 0 D D D D D D DDD O 0 D‏ השא OO flags D D D D D D MP‏ 
U DU 0000 DD D 0 D 0 UD D UD D U D D ERR, D BNEW ENE D 0 0 0 U‏ 
vmenough nenory] D D D D D D D D D D D D D D 0 D 0 0 0 DD 0 0 0 0 0 0 0 0 0 0‏ 
U U‏ 
Can ve just expand an old anonynous napping? */‏ */ 
if [] !file S&![] vnflags & VMSHARED] S&rb parent]‏ 
if [] vna nerge] nm prev, rb parent, addr, addr +len vmflags[] []‏ 
goto out;‏ 
file 0 0 DD 00000 DD 000 DD DDD 0 DD DDD‏ 00000000 
DU 0 0000 DD DD DDD DD D DD D D D D D varre)00000000000‏ 
of D D D 0 D D ot D 0 D በ U‏ 0000 
Determine the obj ect being napped and call the appropriate‏ */ 
specific napper. the address has already been validated, but‏ * 
not unnapped, but the naps are renoved fromthe list.‏ * 
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*/ 
vna = knemcache all oc] vmarea cachep, SLAB 215111] ; 
if J ! vna[] 
return - PM MEM 
vna- >vm nm = nm 
vna--vmstart = addr; 
vna- mend = addr + len; 
vna- xmflags = vmfl ags; 
vna--vmpage prot = protection nap[vmflags & 080፻]፤; 
vna- >vmops = NIL; 
vna--vmpgoff = pgoff; 
vna- xmfile = NIL; 
va- vmpri vate data = NII; 
vna- >vmraend = 0; 
U U 0 0 D 0 D 0 D 0 D D D D D D 0 D 0 D D በ በ በ vmarea struct D 0 0000 
000 SabQ በ በበ knemeache allo | ה‎ 0 D D 0 DDD 0 DD 0 DD B D 0 D D 0 0 


U U D U 
if በ] file] + 

error =-HNAL 

if [] vnflags &[] VMG@ORDOW VMGØ/SUT [] 
goto free vna; 

if [] vnflags &VMIENVATH] + 
error = deny wite access] file] ; 
if Q] erop 

goto free vna; 

correct veount = 1; 


vna- xmfile =file; 
get file] file]: 
error =file- op map] file, vna[] ; 
if error] 
goto unnap and free vna; 
} else if | flags SMP SHAR) í 
error = shnemzero setup] vnal] ; 
if D erop 
goto free vna; 
› 
free_vna: 
knemcache free[] vmarea cachep, vnal] ; 
return error; 
T 
OOO00000000000000000000 
DU Ul flags D VMGO'SDOWN] VMGOSUPD OOO 1000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ free val [00 
vmarea struct ] D הצר‎ DD 0 0 D D D ü 
O flags በ በ ה₪ אא‎ D D D LD DD 0 DD 0 DDD DDD 0 D 00 D 0 0 
00000000 den wite access] ה‎ 0 0 D D DD D D 0 D D D 0 (TH 


get file] 000 DD DD DD 00 ፎከዉ180በ0000000[0 
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U D D DD 0 0 00 fiel operation] 00000000000 00000000 
U U U U በበበ በበበ 0 000 00 0 D 0 0 0 0 0 በ 0 DD DU D 0 U D 0 0 U D U 
00000 generic file map JN D D D 0 0 DD 0 D D D D 0 0 0 
000 vmarea struct 000 vmopsQ OOO WOU DO 10000000 
U file shared mag] D D D D D 1 UD file private map] 00000000000 
U U U UD U U D 0 0 0 0 U 00000000 U DU 0 U ከ U 
i node D D D 0000 D DDD 0000 DDD DD 0000 DD D U 
U U U U U U D 0 0 0 D U 0 0 0 0 0 UU D D 0 0 0 D U 0 0 U 
U D D DD 0 1.0060 D 0 0 D DD readpage( 10 D 0 0 0 D 00 D D D D 0 0 0 
U U U UU U 000 U 
OO update atine( 10 DD 0 0 D 00 D D D D 0 0 0 D D D i einen 00000 
U U 0 U D 0000 U 
00 flags D O00 שא‎ SARDO D I D 10000 shnemzero setup] I D D D Ú 
U U 0 00 U 


በበበ do map()[] 0000 
/* Can addr have changed?? 


























= 
= 
= 
= 
= 
5 
































* Answer: Yes, several device drivers can ዐዐ it in their 
* f op >nmap nethod. - DaveM 
m 
addr = vma- >vmstart; 
U 0 D 0 0000000000 D adi D D DD D D D 0 0 0 0 DO 0 00 0 0 0 0 


D D D D D D add! 
vna link] nm vna, prev, rb link, rb parent] ; 
if [] correct wcount[] 
atomic inc] &ile--f dentry-2d inode- 3 witecout[ ; 
OOOO0000000000000000000000000 ve link DD D D 0 
םםםםם‎ 3000000 
O10 va [] D] C] D. D 0000 0 
O200 ህበበበበበበበበበበበ[በበበ 
D 37 [] vant] D 0 D D በ D D ind [1 D. U C] D 
OO atomc inch x በ 80 ዝበ በበ በበበ በበበበበበበበበበ[በበበበ 0 


በበ השא‎ DDD DDD 0B 0 B B D BED DDD DDD 0 0 0 DD 0 U 
out: 








nm total vm+= len >> PAE HF; 
if [ vnflags & WMIGKED] í 
nm 3 ocked vm+= | en << PAGE SH FT; 
nake pages present[] addr, addr +len] ; 
} 
return addr; 
do map 0 D D D D D 0 D D D D D 000 DDD DDD 0 DD 00 DD D DD 0 0 
OOO000000000000000000000000 nake pages present] [| 0 በ1 
U DU DU D D D U U D D D 0 D U U 0 D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 D 0 0 0 D 0 D D U 
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םםםםםםםםם 
unnap and free vna:‏ 
if [ correct womt[]‏ 
witecount[] ;‏ ב atomic inc] Gile dentry- >d inode-‏ 

vna- xmfile = NIL; 

fput[] filed ; 

/* Undo any partial napping done by a device driver. */ 

zap page range[] nm vna->vmstart, vna--vmend - vna--vmstart[] ; 
በበ] [በ D 0 D D D 0 D D 0 D D 0 0 0 0 D D D D D 0 በ; በ] zap page range 
U D D 0 D 0 D U 
U DD פיי םי‎ 0 DD 11.41 D D 0 D D DES D 11. D 0 Har D D 0 0 D 0 0 4] 
generic file max 1D D DDD 0 0 D 0 D 0 D D 0 D DD 0 DD 0 D 00 D 0 DD 0 0 
U U DU D 0 0 0 D D D D D 0 0 0 D D D D D 0 0 D D D D D 0 D 0 D DUD D D D D D D U 
U U D 0 D 0 D 0 0 0 D 0 D 0 D D 0 D 0 D 0 D D 0 0 0 0 D D D D 0 D 0 D 0 0 U 
O000000000000000000000000000000000000000 
OOOO0000000000000000000000000000000000000 
DU DD D DD D D D D 6nxsQQ00000000000000000000000000 

















6.3 0000 


Unx J0000000000000000000000000000000000 
םםםםםםםםםםםםטםםטםםםםםםםםםםםםםםםםםםםםםם‎ Linx] 
OOO00000000000000000000 arch] 1386] mh fault.c ה‎ DD D 
0000 do page fault] D D D D 0 0 DD D D D D D 0 D 00 DD DUU 


635.1 000000 


30000 םםםםםםם 
O 10 DDD DD DD 0000 DD DD 000000 D DDD 00 DDD D TASK SIZE‏ 
በ 0 D D 000000 DDD D 00000 D me DON DD D GRA D D D 0 0 0‏ 
][ 
D0000000000000000000000000000000000000‏ 
OOO000000000000000000000000000000000‏ 
0 
O0O00000000000000000000000‏ 
GAV) D 0 0 0 0 D 0 DD 0 0‏ םםםםםםםםם 
U U 0 U D 0000000000 U DU U D 00 U D U‏ 


@py A wite D WOOO 
OOOO proc stat [] [] LI [] 
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65.2 000000 


O0000000000000000000000000000 (swpfiled 000 


םםםםםםםם 

U D D D DD D D 0 0 D D D 0 0 D D D D 0 DU D 0 D D D D 0 0 0 D D D 0 0 D 0 U 
הםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ error code DDD 3 
0000 OOOO00 

* bit 0 ==0 neans no page found, 1 neans protection fault 

* bit 1 = 0 neans read, 1 neans wite 

* bit 2 = 0 neans kernel, 1 means user- node] 

በበበበበበበበ 000 ጠበበበበበበበበበበበበበበበበበበበበበበበበ 
present D םה‎ 00 0 0 D 0 0 0 D OOO 10 0 DDD DD DDD D DDD DOD D 00 1 
OO םבםםםםםםםםםםםםםםםםםםםס‎ W000000000000000 
በ]2በ]ጩጠበበበበበበበበሀበበበበበበበበበበ[ሀበበበበበበበ[በ[በበበበበበ[በ 

vmarea struct D D D 0 D ü‏ םםםםםםםההה = םםםםםםםםםםם 
ዳ .በበበ[ በበ do page fault()[] [J‏ םםםםםםםםםםםםםםםםםםםםהם 


U U U D 0000000000 
!* אםםםםםםםםהםםםםםהםםם ההלב‎ 
. asm [] "በወባ %6r2, 70": "=" [] address] [] ; 
vna = find vra[] current, address] ; 
סםםםהםםםההההםםההההאפתהםםהםםםהםהםהםםהםםהםםהםםם‎ 
OOO0O000000000000(0000000000000000000000000 


OOOOOO 
vna = find vnal current, address|] ; 
if [] !vna[] 
goto bad area; 
if J vna->vmstart <= address[] 
goto good area; 
if [] ![] vna- 217] aus & VMGO/€DO] [] 
goto bad area; 
if D error code &4] + /ሚበበበበ በበ” 
*םםםםםםםה*!‎ 
if [] address + 32 < regs- esp] 
goto bad area; 











} 
if [] expand stack] vna, address[] [| 
goto bad area; 
bad area: /*D000000* 
{ 


if error code &A [] 
current--tss.cr2 = address; 
current- >tss. error code = error code; 
current- “tss. trap no = 14 
force sid] SIGHW, current]; /ፆ* 0000000000% 
return; 
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die if kernel[] "Gps", regs, error code] : red */ 


do exit] ዌ፪(3:111[]; *םםםםםם‎ 
› 











~ 
x 


653 00000000000000 


םםםםםםםםםםםםםםםםההאעטםםםםםםםםםטםםםםםםםם 
U‏ 0 000 000 0 000 000 0 0 0 0 םתםםםםםםםםםםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 NOD D U 0 U D U DU 0 U D 0 0 0 U‏ 


D D DD 0 D [ በ D 000 addressUdo page fault( 70 O0 good area] D D D 0 D D D U 
good area: 
wite =0; 
if [ error code 22] {/* 000 V 
if በ 10 ጹ >vmflags &VMVATE] D 
goto bad area; 
wite+; 
} else /ፆበበበ */ 
if [] error_code &1 || 
![] vna- wmflags &[] VMREAD | MEET [| |] 
goto bad area; 





















































OO0000000000000000000000000000000 bed area 
0000000000 wite0 DDD [0 10 

U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U U U D U በበ 000 U 
הםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםה‎ er Supervisor 
U D D 0 D UD D 0 D 0 00 bad area D D DD D D 0 D 00 D D DD 00000 DD 0 U 
U U U UD U U D 0 0 0 D U 0 ND 0 በበበ በበ 0 D DU 0 0 0 0 U D 0 0 U D U D ከ U 
U uuu 

OOO000000000000000000000000000 bande nmfaut( ) 
U U U 











if [] !hande nmfault[] tsk, vna, address, wite[][] + 
tsk- “tss. cr2 = address; 
tsk- ss. error code = error code; 
tsk- “tss. trap no = 14 
force sig] SIGXS tsk]; 
if [ !በ error code &4 | /* 000 * 
goto no context; 

› 

OO bande nmfaut( 170 D D D 0 0 D D 0 D D D 0 D D D D D i0000000 
םםםםםםםםם‎ do page ₪ )I D D D D 0 D D በ GS n 0 በ 
hande nmfaut( )1 00 +0 DD 0 tskKD D D D D D D D 0 האפצטםםםםםם‎ 
D D D 0 DD DDD DDD በ በ በ በ הנפש‎ D D 0 D D D D D D בהא בםואפואם‎ 
[] address] D [ በ D 10 በ በ tskD D በ D በ በ address] 0 በ በ ወ 
handle nmfaul CD | D D D D D D D በ በ | address D D 0 0 D 0 0 D 0 D D 0 [ 


OO address] ה‎ DDD D D D D 0 D 0 0 D D D D 000 DD DDD D 0 000 DD DUU 
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U U 0 D 00 0 0 00000000 
pod = pgd offset] vna- wmnm address[] ; 
pnd = pnd all oc] pgd, address] ; 
if [] ! pnd[] 

return -1; 

pte = 66 alloc] pnd, address] ; 

if D ! pt e[] 


return - 1; 

pod offset] [T] D D address D 0 D D D D] H] D D D D O 1 U D D በ0 D 0 CTI 1386 
U D D D uú pod allot 10 D DD DDD 00 0 0 0 0 0 0 0 0 D D D D 0 0 
pte alloc) ን]1]1]111ህቭቭብበበበበበበበበበበበበመፀበበበበበበበበ[በ[[[ 
0000 address 0 000000 bande pte fault( )O O00 address [00000 


uuu: 
return handle pte fault] tsk, vna, address, write access, Gel: 


handle pte fadt( 10 D D 0 D 0 0 0 D 0 0 D D 0 0 0 0 U 

U U U U D U D 0 0 0 D 0 0 0 0 0 DU U D 0 0 U D U 0 0 0 0000 00 0 00 U 
U U U U D U D 0 0 0 D 0 0 0 0 0000000000 00 U 

U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U በበ U 00 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U U U 

















65.4 OOOO 








- 
- 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
L1 
o 
o 
L1 
- 
- 
- 
























































EEE EL GE EV EE ESI ER ZEE: EE ER 


o 
o 
E E 

Nas 


U U U U D U D 0 0 0 0 000 U DU 0 U D U D 0 0 0000 0 00 0 0 00 U 
U D D 0 0 pte none] [0 10 
በገ በ U D በ] በ 0 000 U DU 0 U D U D U 0 U D 00 0 000 0 00 U 
OOO00000000000000000 OO 00 DD DD 0 D 0 00 Present 
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[] 01] 


handle pte fault] ብ በ በ በ በ በ በ D ፀበጩጨበበበበበበበበበበበበበበበበ 
entry = *pte; 
if [] !pte present] entry] | + 

if [] pte none] entry] [] 

return do no page] tsk, vna, address, write access, 
ptel] ; 
return do swap pagel tsk, vna, address, pte, entry, 
wite access[] ; 











) 

OOO00000000000000000000000(06 swp page ( DODO 

OO00000000000000000 do mo pag 10 D DD DD D D 0000 U 
U U U U D U D 0 0 0 በበበ 0 0 0 0 0 0 0 U D U 0 U D U va 0 [ D D ሀ D U nopage 
U U U በ በበ D DU U D U D U D U D U በ ሀ ሀ ሀቨ UU ה‎ HD. U D UD D U D U O 
nooo መመ D D D D D 0 0 D 0 D D 0 0 0 0 U 

0 1] ዝጽ vmops- nopage | O0 0 ההתא‎ D 0 D D 0 DD 0 D 0 0 D D D D 0 0 0 0 U 
הת‎ D D D U D 0 0 0 0 U 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 U 

D 0 0 D 0 0 U‏ תתא ] | vmops[] | NOOO vna >vmops- >nopage‏ 2700 ם 
dono pagel )DU‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםם 
do anonymus page 10 0 0 0 0 D D D D 0 0‏ 


if [] ! vna- wmops || ! vna- wmops- >nopage[] 
return do anonymous page] tsk, vna, page table, 
wite access[] ; 








do anonymus page] 0 D 0 0 D D D D 0 0 0 0 D 0 
if [] wite access[] + 
page = get free page] GP USER] ; 
nenset[] [| void *[] 0 page] , 0, PACE SIZH] 
entry = 66 nkwite] pte nkdi rty[] nk pte] page, 
va- ym page prot[] [] D ; 
vna- >vm nm rss +: 
tsk- mn flt-+; 
set pte[] pte, entry]; 
return 1; 
} 
םםםםםםםםםםםםם‎ get free pag 10 D D 0 D D D D D 0 D D renset 
U U U D ገ በበበ OOO 00000 רא‎ mnfltgoOo00000000000(M00 


OO00000000)000000000000000 vo- mm ras D nna D Ú 
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U D D DD D 0 0 DDD emty zero page 0000000 10240000000000 O 
U D UD D 00 DDD D 0 00 DD D በበ በ 00000500 D D UD D D D OD ZE PAE 
U uuu 


U D D D 0 በ] D 0 D 0000 D በ U 
entry = 66 wrprotect[] nk pte[] ZERO PAE, vna- -vmpage prot] [] ; 
set pte] pte, entry] ; 
return 1; 


በገ [በ በበ U D 0 0 0 D 0 0 0 0 0 0 0 U D U 0 U D U 0 0 0 0000 00 0 00 U 
O0O00000000000000000000000000000000000000 




















6.5.5 0000 


fork )‏ בםםנםםםםםםםםםםםםםםנםההאא םםםםםםםםםםם 
O0O00000000000000000000000000000000000000‏ 
O0O00000000000‏ 

e 00000000000 

e 0000000000 

םםםםםםםםהםם. 

*。U0O0000000000000000 
נבםםםםםםםםםםםםםםםםםםםםםםםםם‎ GUD DD DD 00000 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 




























































































Page [] 0 0 count D I 0 D D 0 0 0 0 0 D 0 0 D 0 0 00 D 0 0 0 0 0 D 0 0 0 0 U 
OOOO00000000 count 0 ቨ በ III በ 0 count D በ እ11[ DU D D D 0 0 0 0 DU 
U D D D D 0 האתתם‎ D D D 0 ü OW በ handle pte fault( 10 0" 00 
U U 0 U D 00 0000000 U DU 0 0 0 0 0 U D 0 0 U D U ሀ በ ሀ ሀ መዘ ዘ [ከ 0 ሀ U 
































if [] pte present] pte] + 

entry = pte nkyoung|] entry] ; 

set pte[] pte, entry] ; 

flush tlb page] vna, address] ; 

if [] wite access] + 
if [ ! pte witel] entry] [] 

return do wp page] tsk, vna, address, pte[]; 
entry = pte nkdi rty[] entry] ; 
set pte[] pte, entry]; 
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flush tlb page] vna, address[] ; 
} 
return 1; 


} 
00000 pte nkyoung ) በ set ge 10 DD 0000 0 D D 0 0 D 0 0 0 0 0 
በበበበበበበበ በበ” DU" 00000000 000000 0 00 0 D 00 00 00 U 
U D ፲ bande pte fault( ) 000 do vp pag 10 D D D DD D D 0 0 0 000 0 
OOO00000000000000000000 Ger/ Supervisor] 00 GTI D D 0 0 U 
1] 








do wp pagel הנ(‎ D D page ה‎ 0 0 D DD D D D D 0 0 0 D D D rang 


םםםםםםםםם 
pte — *page tabl e;‏ 
new page = get free page] GP UBER] ;‏ 


U U U U D U HERE 0 0 DU U D U 0 U D ם‎ 0 0 0000 000 0 DU U 


U U U U 000 U 
e םםםםםםםםםםםםםםםםםםםהםםםםהםה‎ pte | *page table 
U U U U 0 U 
e םםםםםםםםםםםםםםםםםםםםם‎ Present 000 OD 
s בםםםםםםםםםהםםה‎ Fed Wite[] በ በ 11 
D000000000000000d wp pag 10 D 0 0 D D 00 D 0 0 0 00 10 
U U U U U D 00 በበ በ በ በገ 0 0 D 0 0 D 0 0 UD 0 0 U 0 U page nap 
U U U U 0 U 
tsk- mn flt-+; 
page nap =nemnap + MP Nf] old pagel] ; 
OO0O0000000000000000000000000000000000000 
O0O00000000000000000000000000000000000000 
OOOOOO0O0000000000000" 00” O0000000000000000 
0000000 10000000000 pe 00 cout [00000 
if [] page nap- “count = 19 + 
set pte[] page table, pte nkdirty[] pte nkwitef] pe] DO; 
flush tlb page] vna, address[] ; 
if [| new pagel] 


free pagel] new page] ; 
return 1; 


























} 
DODONG D D D በ D (old page) D 0 0 D D 


D [] D D D D (newpage)[] O 

if [] old page = ZERO PAGH] 

nenset[] [| void *] new page, 0, PAE SIZF] ; 
else 

nencpÿ] [| void [|] new page, [| void *] old page, PACE SIZH] ; 
set pte[] page table, pte nkwrite[] pte nkdi rty[] 

nk pte] new page, vna- -vmpage prot] D D 0; 

flush tlb page] vna, address] ; 


—227 - 









































Ol Linux [ ul 














. free pagel] page napi] ; 
return 1; 


በበበበበ[በበ[800በ80 ה‎ 0 00 D D D D D O00000 mnm: D 
U U U U በ DU 0 U D 0 0 U D U D 0 0 0 0 0 DU D U 0 0 0 0 0 0 0 0 0 D 0 0 U D U 
O0O000000000000000000000000 

O0O00000000000000000000000000000000000 
OO free መጩ( 10 D 0 D D D D 0 0 0 0 0 


656 00000000 


01000 fork] J000000000000000000000000000000 
U U 0 0000 U 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםתם‎ 
OO000000000000000000000000000000000 םםםה:‎ 
םםםםםםםםםטםםםםםםםםםםםםםםםטםםםםםםםםםםםטשם‎ 
OOO0000000000000000000 
































6.6 0000 


םםםםםםםםםםםםםםםםםםםםםםההאתפםםםםםםםםםםם 

ewen QO000000000000000000000000‏ םםםםםםםםםם 

U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UU U 000 U 


661 0000000 
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U U 0 U D 00 0000000 U UD 0 U D U 0 0 0 UD 0 0 00 0 0 0 0 D 0 0 U D U 
OO0O0000000000000000000000000000000000000 
םםםםםםםםםםםםםםםםםםההאבבםםםםםםםםםםםםםםםהםם‎ 




















U U U U D U DU D U 0 0 0 0 0 0 0 0 0 0 0 0 U D 0 0 UU 0 0 0 0 U 0 0 0 0 0 U 
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በገ U D U 0 00000000 00 0 U D U 0 U DU D U 0 000 00 0 0 DU U 
OOO000000000000000 


1[01010[ 00 U 
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O0O0000000000000000000000 
םםי*םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U unun 6.18 
020000000 me 10 DDD D D D 0 0 0 D 0 0 U 
U A) D U 000000 U 
በበበ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U 0 U D 0000000000000 U 000 U 
000 200000000000000000000000000 
000 300000000000000000 
O0O00000000000000000000000000000000000 
D0O00000000000000000000000000000000000000 
OOO00000000000000000000000000000000000000 
O0O0000000000000000000000000 
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0200000000 ה ה 90 וא‎ D 00 D D D D 0 D 0 D D 0 D DDD 00 0 U 
DOO0000000000000000000000000000000000000 
OOO00000000000000000 



































— 229 - 





























[ Linux | Ol 


O0O0000000000000000000000000000000000000 
ገበበበበ" በ 0 U D D 0 0 መጠበበበበበበበበበበበበበ”በበ "00 00 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
በገ [በ U U D 00 0000000000 U 

םםםםש 0000000000000000000。 
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[] [] [] 
OOO0000000000000000000000000000000 
U U U U U U D በ 








U U U U D U 0 00000000 0 DU U D U 0 U DU 0 0 0 0 0 0 0 0 0 0 U uu 
U U U UD U U D 0 0 0 በበ 0 0000000 DD 0 U D U 0 U D U D U 0 U D 0 0 0 U 
בםםםםםםטםםםםםטםםטםםםםםםםםםםםםםםםםםםםםםםם‎ IR 
U U 0 U D U 0 00 0 00 0 0 0000 0 D U D 00 U DU D U D 0 0 0 D 0 0 0 0 0 0 U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
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U D D D 0 0 0 መመበ00[00[ D D D Gch D D D 0 D D D D 00 Activel] D D Ü U 
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םםםםםםםםםםםהה הססוםםםם 


0300000000000000 
O ה ][ 0000 ה‎ active list] 


090000" Dr 











U U U U D U D 0 0 U D 0 000 U 
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U U U 


በ በሀበ በሀ በሀ 00 D 0 DD D D pge 000 
OO free ared](] D D በ D 0 D cow D 10 
000 alloc pages()[] get free 86መፎ()10በ1[1[ 0 Ú 
U [ D D 0 count 00 10 
OO0O000000000 paged 





U U U U D U D 0 0 U D 0 000 U 


תםםםםםם"ם 
U inactive dirt‏ ה 
םםםםםםםםם 
םםםםם"ם. 


U U U U D U D 0 000 U 








יםםיםם 
page [000000000 iran Do‏ בםםםם" 
00“00”000Q0 inactive‏ 
OOO0000000000000‏ 








O0O0000000000000 















































OOOO pagg 0 000000000 trui 


U D U U U U 0 0 0 0 Page000000 u^ 
I0000000000 

















U U U U D U D 0 0 U D 0 000 U 


440000000000 




















U D DDD GOD D D D D D DD 00000 DD DD 0 D 0 0 0 
U U DU 0 0 በ Hm 000 0 0 D 0 D 0000000000000 U 
U U 0 U D 0 0 00 0 0 000000 0 DU D 0 DD U D U 0 U D U 
OOO0000000000000000000000000000 
OOO0000000000000000000000000000 
O0O0000000000000000000000000000 
U D O0GnsQ00000000000000000000 ksvepd] 





U U U 
U U U 


U U U 
U U U 



































U U 


"Aa AA ARA 
ETEN: ELE 


nm 
nm 








L3 L3 L3 E3 O E3 መ בם‎ 


o9 





ET EE," EL Ek Ex EI 


nm 
o 


page [10 


U U U 0 U U 


U Uu 


U U U U D U 
U uuu 

















U uuu 





ם"םםםם 


clean list] 


U U U U U U 





U U U U D U 








U U 


U U U U D U 
U U 0 U D U 


U U U U 0 U DU D U 


U U U U D U 
U U U U D U 


פםםםםםםםםם 
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662 00000000 ksvapd 


U D D D D 0 aen 0 D D D D D 0 0 0 0 D D D D D [ [በ0 task struct NO D D 
O0O00000000000000000000000000000000000 
U D D 000 DD DD DD D D 0 D 0 Kaved D 0 0 0 0 DD 0 0 D D 0 0000 0 U 
OO0000000000000000"00”OO000000000 ksvpdp [J 
U U U UD U U D 0 0 0 D 0 0 0 0 U 00000 00 0 U 0 U 0 U D U 0 U 0 U D 0 U 
U U U D U በ D 0 0 U D U 0 0 0 000000 00 0 U 0 U 0 U D U 0 U 0 U D 0 U 
kswapd 00000000 måvnscan. ር በ በበ 619000 האש‎ 00000 
U U 0 0000 U 



























































EE EX EA EL E E= 

















E3; ELE, EE) 
































kswapd() 





v 
kswapd balance) swap out mm() 
v 
Try to free pages() swap. out vma 
v 
shrin cache() swap out pdg 
v 
Swap out()[] refill inactive() swap out pmd() 








try to swap out) 










Rw swap page() 


Brw()_page() 


0 619 ksvapd DD DD NN 000000000000000 


D D D 0 0 0 D 0 0 0 00 DDD D 000 0 U‏ האפשםםםםםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U D U 0 U D 0 0 0 U‏ 
U U U UU U D በ;‏ 


10 ksvapd |] [] 


በ Tnx 24100000000 השפ‎ D 0 DD 0 0 DD 0 D D D 0 DDD 0 D 
םםםםםםםםם‎ 
int kswapd] voi d *unused] 
{ 


םםםםםם 





םםםםםםםםם 


struct task struct *tsk =current; 
IETAE VATQ HUE] wit, tsk]: 


(801271 [| ; በማሣ! በብ. በኝ 
strcpy[] tsk->conm "ksvepd"[] ; 
51 [1115] &sk >blocked]; በግበበ FPBIO0000000000 א‎ 


-232- 


























Linux | 























/* 

* Tell the nenory nanagenent that ve' re a "nenory allocator", 
* and that if ve need nore nenory ve should get access to 11 

* regardless [] see" alloc pages] O "O. "ksvapd" should 

* never get caught in the nornal page freeing logi c. 

3k 

* [] Ksvapd nornally doesn't need nenory anyway, but soneti nes 
* you need a snall anount of nenory in order to be able to 
page out sonethi ng else, and this flag essentially protects 
* us fromrecursi vely trying to free nore nenory as ve' re 

* trying to free the first piece of nenory in the first place]. 
*/ 


tsk >flags | = PF MMIC D *] 000000 kveedn *םםםםםה‎ 





/* 
* Ksvapd nain 1 oop. 
*/ 
for Q;;O + 
. Set current state] TASK I NTERREPTI HE] ; 
add wait queue] &svapd wit, Set LD ; D ግ] ksvapd םח הבה ה‎ ግ] 
moo; O*00000000% 
if [] ksvapd can sleep] [ 0 በግገበበበበበበበበበ” 
schedul ef] [] ; በግገበበበበበ” 
set current state] TASK RAN NG]: | ף*‎ ksvapd *חה םה הה‎ 
renove wait queue] Sksvapd wit, Gait]; D ግ] *הההםםה ההש‎ 
/* 
* If ሄይ actually get into a lownenory situation, 
* the processes needing nore nenory wll wake us 
* up on a nore tinely basis. 
*/ 
kswapd balance] 0 ; 0* kswpd D በ በ በበበበበበበሣ 
run task queue] &q disk]: הה* ה‎ tq disk *הההההה‎ 
› 
› 
ksvapd(] (1 (] 0 0 0 0 1በ 00 0 0 D 00 DD 0 0 
static int init ksvapd init] void] 
{ 
printk] "Starting ksvapån"[] ; 
swap setup] [] ; 
kernel thread] ksvapd, NIL, QQ FS | GONE HIE | GONE IMJ; 
return 0; 
T 


D 0 DDD DDD DDD DD 0 DDD D በበ ksvapd init] 
nodul e init(ksvapd init) 


U D D DD 0000 D D kaved D NO 00 D D D D D 0 0 000 DD DD 0000 U 
םםםםםםםםםםםםםםםםםםםםהם‎ i000000000000000000 
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OOO0000000000000000000000000000000000000 
U uuu 


2] ksvapd bal ance()[] [J 


በገ U D U D 0 0 0 D 0 0 0 0 00 0 U DU 0 U DU 0 0 0000 0 D 0 0 DU U 
םםםםםםםםםםםםםםםםםםםםם‎ 3000000000000000000 


U U D D 0 0 D D DD 00 DD DD D D D DD D D D D 0 0 D D D 0 0 D 0 U 
static void kswapd bal ance] voi d] 
{ 














int need nore bal ance; 
pg data L * pgdat; 


do + 
need nore balance = 0; 
pgdat = pgdat list; 
do 


need nore balance | = ksvapd bal ance pgdat[] pgdat[] ; 
while [] [] pgdat = pgdat- “node next[] [| ; 
ት while [] need nore balance] ; 


} 
U U BH BH 00 DU U UU 0 0 D U U 0 00 0 U B םי םי ם‎ 0 U 0 U 


ksvapd balance 99911 D 00000000000 
static int ksvapd balance pgdat[] pg data t * pgdat[] 
1 
int need nore balance = 0. i; 
2006 L * zone; 


for i =pgdat->nr_zones-1; i >=0; i--[] + 
zone = pgdat- “node zones +i; 
if [] unl i kel y] current- need resched] [] 
schedul ef] [] ; 
if [] !zone- “need bal ance[] 
cont i nue; 
if [] ! try to free pages] zone, GP KSWPD 0] ך‎ + 
zone- >need bal ance = 0; 
. set current state] TASK I NTERREPTI BLE] ; 
schedule tineout[] HA] ; 
conti nue; 
} 
if [ check cl asszone need bal ance] zone] [] 
need nore balance = 1; 
else 
zone- 2need balance = 0; 
) 
D DD DD DDD DD try to free pages] DD D D 0 0 D 0 0 0 0 D D D D D D 
need balance] OO 1P 00000000000000000000000000000 


check classzone need 0 ה‎ D 0 D D 0 0 D 0 0 D 0 00 D 0 DD 0 0 D D 0 0 0 
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D [| D try to free pages] M‏ ם 


























3] try to free pages] [] 


םםםםםםםם 
int try to free pages[] zone t *classzone, unsigned int gfp nask unsigned int order]‏ 
{ 
int priority = DFF PR CATY;‏ 
int nr pages = SWP (1180 MX‏ 


gfp nask = pf gfp nask] gfp nask[] ; 
do + 
nr pages = shrink caches] classzone, priority, gfp nask, nr pages[]; 
if [] nr pages <= 0] 
return 1; 
} while [| -- priority] ; 


1% 
* Hm. Cache shrink failed - tine to kill sonethi ng? 
* Mivahahhaha! This is the part I really like. Gggle. 
El 

out of nenory[] [] ; 

return 0; 


} 

DF PRO A0000‏ בםםםםםםםםםםםםםםםםםםםםםםםםם 
029000000000 6000000000000 9000 000000000 
3270000000 ןא 5 nr pages [] D D BE] D D D 0 0 0 0 D 0 SW‏ 600 0 
O00 shrink caches] (T‏ 


static int shrink caches] zone t * classzone, int priority, unsigned int gfp nask, int 
nr pages[] 
1 


int chunk size =nr_pages; 
unsi gned 1 ong ratio; 


nr pages -= knemcache rean) gfp nask] ; 
if [ nr pages « 0] 
return 0; 


nr pages =chunk size; 
/* try to keep the active list 2/3 of the size of the cache */ 


ratio =[] unsigned long] nr pages * nr active pages / [| O nr inactive pages +10 
* 20; 
refill inactive] ratio] ; 


nr pages = shrink cache] nr pages, classzone, gfp nask, priority] ; 
if [ nr pages « (f 
return O: 


shrink dcache nenoryf] priority, gfp nask ; 
shrink i cache nenoryf] priority, gfp nask[] ; 
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1 if def CNIG TOA 
shrink dqcache nenory] DEF PA CATY, gfp nask) ; 
Hendi f 





return nr pages; 


› 

OO knemcache read] 1 D D " OO (reap)” 0 sl 0 0 0 DD D 0 D D D D D 
slap 00 000000000000000 n ה‎ D ü ü D D 0 DD 0 U D D 
refill inactivd] DD D D D D D 0 D D 0 0 D 0 0 D 0 0 0 [0 shrink cache] 00000 
በ O00" 00000000000000000000000000 
በበገበበበበበበበበበበበሀበበበበበበበበበበበበበ[በበበ[በ[በ 
shrink dcache nenoryf] [[] shrink i cache nenory] [| [| shrink dqcache nenory] [| [| [| 
0000000000000 0000000000000 000000000000 
00000000 detry D D 00000000000000 ፤ጩመጩበበበበበበበበበበ 
U 0 DDD DDD DDD DD 0 0 D 0 D 0 መጠበበበበበበበበበበበበበበበበበበ 
DU DD DDD DDD DD DD D 0 0 D 00 D D በ በ D detr D 0000 inode[ [ D D D 
U D D D 0 0 D 0000 DD DD D D D D D D D D 0 D D 0 D 0 D 0 U 


410000 


OOO0000000000000000000 svep out] UU shrink cache] N [J 
DOO000000000000000000000000000000 

shri nk cach] D D 0 0 0 D D 0 D D D D 0 D D D D D 0 0 U" 000” Roo D 
“OOOO” bO D DDD DDD struct page] 0000000000000000 
U U D U D 0000000 U 

e I0000000000000000000000000 שא‎ 

s UDUDDUDUUUDUDUODUDUDDUDDUDDUUDUDUUDDUDUOUDDUUD UI 

s 111 [111111111101:11111111111111 1111111111] 

e הנ(םםםםםםםםםם)םםםםםםםםםםםםםםם‎ 























מםםםםםםהם 663 


H mnp D םםםםםםםםםםהה‎ 0 DD swpon[] svapoff 00000000000 


D 0 D 00 DD DD swp info struc O00000 

struct swap info struct + 
unsi gned int flags; 
kdev t swap device; 
spi nl ock t sdev lock; 
struct dentry * swap file; 
struct vfsnount *svap vf snmt; 
unsi gned short * swap nap; 
unsi gned int lovest bit; 
unsi gned int highest bit; 
unsi gned int cluster_next; 
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unsi gned int cluster nr; 


int prio; /* swap priority */ 

int pages; 

unsi gned long nax; 

int next; /* next entry on swap list */ 


L 


extern int nr_swap pages; 
flag [] (SW BD] SP WTER] םםםםםםםהםהםהה‎ svepoff 00000 


SP WEO tD D D 0 0 0 0 D D D D 0 0 D D swpon[] 0 0‏ םםם םםםםםם 
D D DD D D D D D 0 00 (or swepfiles)QOO0000‏ השש שפםםםם םםםםם 
U U U U DU U‏ 
በ lowest bit[] highest bit 0 0000 D D D D 0 0 0 D D D DDD 0000 D U‏ 
U D D D D svwp 00000000000000000000000 000000‏ 
O0000000010000000000‏ נבםםםםםםהםםםםםםםםםםםםהם 
U U‏ 




















U 0 D 0 D 0 0 svepon([ UO D 0 D 0 J D D swp nag] 
swp mapi D D D 1111110101 1010 00000 D OD DD 0 00 12800 
OOO00000000000000000000000 swep[] I Ú 
U 0 D 0 DD 0 D get pag] D D D D D D D D 0 D D 0 0 0 D D U U 
U 0 000 DDD D 0 3 D 000 DDD በበ 0 DD DDD 00 DD D 0 0 0 
U do no pe) [1000 7000000000 4000000000000 
0000 swp duplicate()[] copy page tablesOQ םה‎ 00000 forkOO D DO 
U 0 D D D 0 00 D D D DD seer OOOO count 0 00 D 0 D 0 U D UU D UL CE I 
םםםםםםםםם‎ 
swp free()[] D 0 svap nap[] | count [| 0 [] | השס‎ | ዐ]1111[11 በ] 1 [ 
U D ם‎ get svap page) D ] D 0 በበበበ 0 D D መ in D D D D 0 D D D UNU 
Q free one table] [| | swap free()[] 


U D D D D D D filenap.cQ Ú 


























664 0000000 


םםםםםםת 


U U U U D U D 0 0 0 D 0 0 0 0000 000 0 U DU 0 0 0 000 0 00 0 U UD 
በበበበ በ UU UD DUDU 0000 D 0000000 U 

U U U U D U D 0 0 0 D 0 0 000000 DU 0 UD U 0 0 U 0 0 0 U U 0 0 U D U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 


ut 
$ dd if dev/zero of 4 extra svap bs=1024 count 22048 
204840 records in 
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204840 records out 
םםםםםםםםםםםםם‎ extrasvep 000 204880 000000 i380 0 
በበ በበ DD 0 DD DD 4800000000000 KQOOOOOOOOG A pha AP 
בםםםםםםםהא םםםםםםםםםםםם‎ 

OO0000000000000000000000000000000000000 
OOO0000000000000000000000000000 nx Sep D D U U 
OO 82] [ 
U U D 0 D 0 0 D D 0 D 0 D D D D 0 0 0 D 0 D 0 0 0 0 0 D D D D D D 0 D 0 0 U 


ጩመጩ]]በበበበ D‏ םבםםםםםםםםםםםםםםםםםםםם 
nksvap /extra-sw 2048‏ $ 

Setting up svapspace, size = 2088960 bytes 

$ 


OO0000000000000000000 swp 00000000000000 
U U U U U U D 0 0 0 DU D U D U D 0 0 0 D 0 0 0 00 0 0 0 0 0 0 0 0 0 D 0 0 U D U 

Dom D DDD 00 DDD D DDD 00 0 D D D D 27 0 000 (40%.10)* 
8*4096 = 133890048 Byte = 127. 673981 D D D D 0 0 0 D D D D 1600000000 
םםםםםםםםם‎ 24 


2000000 
OU swpon U U 0 0 D U 0 0 0 0 በ በ 0 0 0 0 0 0 0 0 0 ሀ በ U 


% swapon /extra- swap 


$ 


000 /acfstaboQOOOOOOOOOOOOOOOOOOOOOOO 
/ dev/ hda5 none swap sw 0 0 
/ extra svap none svap Sw 0 0 


;:ጩፎ-8በበበ00000000 /etc/fstab [] O00‏ בםםםםםםםםםם 
U U U UU U D 0 U‏ 
OO free 0000 DDD DD 0000 D DDD 0 0‏ 


$ free 

total used free shared buffers 
Mm 15152 14896 256 12404 2528 
-/+ buffers: 12368 2784 

Svap: 32452 6684 25768 

$ 








































































































U D D DD 0 00 DD Mm 0 OOOO0000000000000teta [0000 
U D D 0 D 00000 used D D D D D D 0 0 0 D 0 freed D D D D D D UU [shared 
OO00000000000000000000000bffes םםםםםםםםםםםה‎ 
U uuu 
םםםםםםם‎ 0 Sap: D OOO000000000000000000000 ሟ 
U U 0 U D 0 0 000000 U 

OO te D D 0 00 /proc DDD 0 [0 /proc/nemnfo 00000000000 

OO svapoff [000000000000000000000000000000 
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U U 0 U D 0000 U 
59 -aQ O00 /etc/fstab 0 0 0 DD D D D D 0 D 00 DD D D 000 0 U 
U U 0 U D 0000000 U 






































A) DD 0000 

U U U U D U D 0 0 D 0 0 0 DU 0 DU U D 0 0 U D U 0 0 0 000 U D 0 0 U D U 
ררההההםהםםםםםםםם‎ U U U 

fred p 0000‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםשם 
U U 0 U U 000000000 U‏ 

0200000000000 

0S0000000000000000000000 M) DD DD DDD 000 U 
U U 

N4000000000000000000000000000000000000 
OOO0000000000000000 

0S)000000000000000000000000000000Gnme OOO 
DOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
O0O0000000000000000000 





















































67 DOOOOOO 


6.7.1 linux[] [000 


ODOO000000000000000000000000000006m 0 0 0 U 
U U U U 0 U D 00 0000 U 


מםםםםםםםת 


U U U U D U D 0 0 0 D 0 0000000 DU 0 UD 0 0 0 0 000 00 0 0 DU U 
U U U UD U U D 0 0 0 D U 0 0 0000000 NON D U 0 U D U D U 0 0 D 0 0 0 U 
U U U በ በበበ በበበ D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UU UD በ 
OOO000000000000000000000000000000" 00 dirty" 
DOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
DOO000000000000000000000000 

O0O00000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
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U uuu 
20000000 


OOO00000001/0000000000000000000000000000 
read( )[] wite( ን max 10 D 0 0000 D D D 0 0 0 D DD D D D D 0 0000 0 U 
OOOO 1/00000000000000000000000000000000000 
U U U UD U U D 0 0 0 D U 0 0 0 UD 0000000 0 D U 0 0 U U D U 0 0 D 00 0 U 
U U U [በ U በ 0 0 D 0 0 0 0 U DU 000000000 0 0 U U DU 0 U D bu 

OO0000000000000030000000000000000000000 
O0O00000000000000000000000000000000000 


םםםםםםתף 

































































































































































OO0000000000000000000000000000000000000 
OOO00000000000000000000000000000000000000 
OOO00000000000000000000000000000000000000 
OO00000000000000000000000000000000000000 
OOO00000000000000000000000000000000000000 
OO00000000000000000000000000000 םםםםההאת‎ 
U U D 0 D በ] D D D 0 D D D 0 0 D 0 D 0 D D D D D D D 0 0 D 0 D 0 D 0 D D D D D U 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 D D D D D D D 0 0 D 0 D 0 D 0 D D D D D U 

D 0 DD 0 DDD D DDD D 0 DD 0 D D D D linx/nmsvap state. c [| [| 

U U D 0 D 0 በ D 0 D 0 D D 0 D 0 D U 

extern unsigned long init swap cache] unsigned long, unsigned long] ; 

U U D 0 D 0 0 D 0 0 D U 

extern void show swap cache info voi d] ; 

םםםםםםםםםם 











int add to swap cache] unsigned long index, unsigned long entry] 
האפפגםם‎ D D D D D D D D ind] 0000000 etyD0 0000’ 
በበ በበበ D D 0 0 በበበ 0 D D D D D D 0 D 0 D 0 D D 0 0 0 0 0 U 


םםםםםםםםם 
extern void svap duplicate] unsi gned long] ;‏ 


000 copy መመ tables) ה‎ D D D D D D 0 0 0 םםםםםםםםםםהםה0‎ 
בםםםםםםם‎ 


0000000000 
del ete fromsvap cache] page nr] ; 


U U U U DU U 
U U U U D U D 0 0 0 D 0 0 0 00 DU U D U 0 U D U 0 0 0 000 U DU 0 0 U U U 
በገ UD D U D 0 0 0 በበ ገበ 0 0000000 00 0 U D U 0 U D הפר‎ 





L1 
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6.7.2 0000000 


Enx] םםםםםםםםיםםיםםםםםםםםםםםםםםםםםםהםםםהה‎ 
በገ U D U 0 00000000 000 U DU 0 U D U D U 0 U D הפר‎ 
םםםםםםםםםםםם‎ buffer head] DD D D 0 0 0 D D D D D D 0 0 0 0 0 0 
U U 0 U በ] U 0 00000000 000 U UU 0 U DU 0 U D U D U በበ በበ 
U D D D D 0 00 D page D D NO buffer head buffer | 0000000000 
OOO00000000000000 
O0O00000000000000000000000000000000000 
U U 0 U D U 00 U 
U U U U D U D 0 0 00 0 000000 U DU 0 U DU 0 0 0 000 0 00 0 00 U 
OO መበ D D 0 0 0 0 0 D DOWN 0 0 0 D D 0 D 0 0 0 D D 0 በ ሀ 0 OO Dom 
םםםםםםם‎ date D D D 0 0 0 D D D D D 0 D 0 0 0 D 0 ₪ 00 D D 
U U U U D U D sync D U 0 0 0 D D U 0 sm 0 0 U በበ D U D በበበ U D 0 DU 
OOO000000000000000000000 30000000 

sync] D D D 0 [0 D D D ጫ=ር()[ D 00 

dbflush ] Lin D D 00 update [I0000000000000000000 








































































































OOO000000000000000000/sbin update] [] 


O L3 בם‎ መጩ EJ E3 O O E3 E3 E3 O E3 EJ 
El; EE ELE ELE EST: ESI ET EST EL EI: EI 


፦ 
፦ 





፦ 





םםםםםםםםםת 


U U U U D U D 0 0 U D 0 0 0 0 0 0 0 0000 U D רהה‎ 000 U 
U D DDD 000 DD DD DD 62000000000 page hash table 0 0 l 
nemnap t([] struct page ה‎ D 0 D 70 0 0 0 00 D D D D 0 D 0 D Dm 
በገ U D U 0 0000000000 0 U DU D U D U DU 0 0 0 U 


= 
= 
= 
= 


[] 
[] 
[] 
[] 


= 
= 
= 
= 


UmeQ 000000 D DDD 00 620000000000‏ םםםםםםםם 


- 

- 

- 

- 

- 

- 

- 

- 

- 

- 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

o 

L1 L1 

L1 E 

L1 L1 

L1 L1 

L1 L1 
EE .בת‎ SEE) EO, I.E :די‎ NER E) 
EL a Ta HN e ENE EIDEM: w EINER 


በገ በ ገበ 0000000 U DU በበበ D U 0 U D 00 0 000 0 00 U 


- 
L1 
L1 
L1 
L1 
L1 
L1 
El 
L1 
CI 
L1 
L1 
L1 
L1 
L1 
L1 
L1 
L1 
E 
L1 
L1 
L1 
L1 
= 
L1 
L1 
L1 
L1 
L1 
L1 
EJ 
L1 
L1 
L1 
L1 
L1 
E 
L1 
L1 

































































U U U U 
0 Hn DD D D D D page hash table 0 D D 0 0 0 D 40000000 
OO inode በበበ 0 0 0 D DD DD DD 00 DD TSDD DDD DD 0000 U 
םםםםםםםםםםםםםםם‎ VSDHUD שו‎ 00000 
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U U 
U U 


U U 


U U 





በ1ጩርቦዩ OOO‏ םבםםםם)םםםםםםםםםםםםםםםםיםםםיםםם 
generic file readahead| D D 11 70 D D 0 D 0 D 0 D 00 D D D D 0 D 0 0 0 D D 0 U‏ 
































Ol Linux [ [] [ 
םםםםםםםםםםםםםםםםםםםהםםםםםםםםםםםםםם‎ 
find page [] struct inode * inode, unsigned long offset] [] 
םםםםםםםם‎ 


























page_hash_table 


mem_map_t mem_map_t 








inode inode 12 


offset offset 0x8000 





























0 620 Hm 0000000 


םםםםםםםםםםםםםםםםםםםםםםםםםםםםיםםםםיםםםם 
U U 00 0 0 D D U D D D 0 D D U D D መጩቶ፥ሀበሀበ በበበ በበ 0 D 0 0 U‏ 


U U D U 0 0 D 0 00 U 
for [| page = page hash] inode, offset[]: page ; page = page- “next hash] 








/* ם‎ page hash] *םםםםםהםםההה‎ 
{if [] page >i node ! = inode[ | 
conti nue; 
if [ page >offset != offset[] 
conti nue; 
/ፆገገገበበበበ v 
atomic incl] Spage- æount[] ; 
set bit] FG referenced, Spage- >fl ags[] ;/*0 O00 */ 
break; } 


return page; 


} 

Dom Un‏ בםםםםםםטםםטםםםםםםםםםםםםםםםםםםםםםםם 
OOO00000000000000‏ 
JO 0000000000000000000000000000‏ אתםםםםםם 


O0O0000000000000000000 
DOO000000000000000000000000006nms 00000000 
אאתםםםםםםםםםםםםםםםםםם‎ 0 0 DD 000 0 0 DD 00 0 0 0 U 
U U U U DU U 



































5 


U U 
U U 
U U 
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2000000000 
OOO0000000000000000000 add to pag cache0D 000000 


“OOOO” 00000000 


static inline void add to page cache] struct page * page, 

struct inode * inode, unsigned long offset] 
+ /በበበበሀበበበበበበበበበበበበበበ[ሀበበ[በበበ[በ * 

page- “count +; 

page “flags & +] [] 1 « FG uptodate] | [] 1 « PG error[] [] ; 

page- >offset = offset; 

add page to inode queue[] inode, pagel] ;/* 00000 inodef 000 */ 

add page to hash queue] inode, page] ;/* 00000000 page hash tabl e[]*/ ) 
U D Pincode] 00000000000 


OOO page hash tabl e[ II OOO 
extern struct page * page hash tabl el PACE HASH SI ZE]; 


םםםםםםםםםםםםטםםםםם 
static inline void add page to inode queue] struct inode * inode, struct page * page]‏ 
struct page **p = &node- 4 _pages;/*] OO 000 V‏ + 
inode- > _nrpages++/*Q 000000000000 Im‏ 
page i node =inode; /*7 0 0 0 0 0 0 D 00 0 D 000 DDD 0 D >‏ 
page- >prev = NIL;‏ 
page amet =*p != MII!‏ ה ה if‏ 
page- >next->prev = page;‏ 
*p = page: }‏ 
םםםםםםםםם 
static inline void add page to hash queue] struct inode * inode, struct page * page]‏ 
struct page **p = Spage hash] i node, page “off set[] ;‏ + 
page cache size /*] 00000000000 1‏ 
set bit] FG referenced, Spage- flags] ;/*1 0000 */‏ 
page- “age = PAE XE VALE /*0 000000“ 00” 000000000‏ 


page- >prev_hash = NII; 
if 0 0 page- “next hash =*p] != NI 
page- “next hash >prev hash = page;  *p = page; 


} 

U D DD 0 0 D 0 በ 

renove page fromhash queue] page]: /*1 000 
renove page fromi node queue] page] ; /*[] inode 





00000 
00000 





6.7.3 0000000 (BB 


በገ] በ D U D 0 0 0 D 0 0 000000000 U DU 0 0 0000 0 0 0 0 DU U 
በበበ በ] በ] U 0 00000000 000 U 00 0 U DU 0 U D U D U 0 0 0000 U 
U U 0 U D U 0 0 0 000000 00 0 U U U U መበበበገበበሀ 0 0 0 0000 U 
O0O0000000000000000000000000000000 

O0O00000000000000000000000000000000000 
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DOO0000000000000000000000000000000000000 
































OOOO0O000000000000000000000000000000000 
םםםםםםםםםםםםםם‎ TRE ב‎ D UU D 00 Translation Looksi de Buffer), l 
U D D D D 0 [ םב‎ D (Associative הפא‎ 00 62100 D D D D 0 Mn DDD 0 U 
בםםםםםםםםםםםם‎ 60080380 3200 

















0621 0000000 
































000 B80OOOOOOO00000000000000000000000000 
0O0000000000000000000000000000062000 
U U 0000 U U U U U U U U U U 
1 7 RW 5 1 
7 16 RW 1 1 
0 33 RX 4 1 
4 72 RX 13 0 
8 17 RW 2 1 
7 34 ፲፳ 2 1 
0622 0000000000 8 





U D D DD 0000 MUD D 0 0 0 0 00 DD D םםיםםם)םםםםםהםרעצ‎ 
U U 0 D 0 00 00000 "BOND DN 0 0 0 00 D 000 0 0 0 0 D 0 0 0 HBI DÚ 
םםםםםםםםםםםםםםםם‎ BOND 0 0 000000000 D 0000 U 
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[ Linux [] [ 

U U 0 U D 0000000000000 U 

በ MUD D ሽክ] 0 D D 0 0 D 0 0 0 0 D 0 0 0 0 D D D 0 0 0 D 0 םםהעע‎ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 200 
U D D 0 0 0 םםםםםםםםתש‎ BB 0 0 0 0 D D D 0 0 0 0 0 0000000 U 
U D D 0 00 UD UU 0000 D 0 0 םםםםםםםםםםםםםםםםםםהש‎ 

םםםםםםםםםםםםםםםםםםםםםםהםההפסםםםטםםםםםםםם 
00000 שםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
UO D D D D D D D D በበ flush 11ክ)[ D‏ 

B00000000‏ םםםםםםםםהההצ םםםםםםםטםםםםםםםם 
40000000 0 נבםםםםםםםםםםםםםםםםםםםםםם 

U D DDD DU 0.89 D D D D 0 00 200000 B000 000000000 






































[] [] O. 85x ( 154120) # 1- 0. 85) א‎ (15412044120) 1453] 0 |] 


6.7.4 [ODD 


I D D D TB 


OOOO 08000 BB) D 0 D 0 0 0 0 0 MUD 0 0 0 0 0 D 0 0 0 0 0 U 
U U U U DU U 
בםםםםםםם‎ ፳8%[ 0 0 00 MP3] A pha] P PAO D D 00 D 0 0 U 
םםםםםםםםםםםםהםםהפצםםםםםםםםםםםםםםם‎ HB 
השא‎ D D 0 D 0 0 0 0 D 0 D 0 0 0 0 0 0 D D 0 0 D 0 0 םםםםהעצ‎ 
םםםםםםםםםםםםם‎ BD D DN 0 0 0 0 00000 0000 0 U 
העע םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U U U U D 0 U 
000000 BD DDD DD DD 000 D (00 000)0000000 
00000 TDD D 0 0 0 00 D 0000 0 00 0 0 D D 0 0 0 0 MOOD 
በ GUD D 0 00 D D D D 0000 DDD DDD 000 DD DD 00 0 
U U 0 D 0 00000 D 000 0 0 0 TS) D D 0 0 UD 0 D 0 0 D DU TB 




















E EL ET iE 3^ EST ea T EL EL s Tea T ea LE Ee 









































ET ET EE EE ET EE EE Ea CL መጨ EI יכ‎ ES DER 
ENES ES EL בי‎ = ER EN SESS EL: BERE Ey EME) 21, EL = NR 
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200000 


U U 0 0 0 U םםםםםםםםםהבתע םםםםםםםםםםםםהםםםםחש‎ 
በገ U U U D 00 0000000000 U 
በ] inx 0 DD 0 0 (0 D BD D 000 DD DDD 00000 DD DD 0000 U 
U U 
(D O0000000000000000000000000000000 
(2 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U U 0 0.0 0 0 0 D 0 U D U 0 U D U D 0 U 
DU D D 0 000 wit 0 םםםםםםםםםםםםםםםםםםםםםםםהםהה‎ 
U U U U D U D 0 0 0 D 0 0 0 0 0000000000 00 U 


D0000000000000000000000000000000 


በ ox םםםםםםםםם םםםםםםםםםםםםםםטםםםםםםההה‎ 


פםםםםםםםםם 

flush cache foo] D: 

flush tlb foo] [; 

U DU DU U DD U D D D D D U 0 U D D 0 0 NENE 0 0 0 0 0 0 U 
OOO00000000000000000000000000000 flush cache * 
በበበበበበበበበበበበበበበ 00000000 MUD D 0 0 D 0 D D D 0 D 00 D U 
U U D 0 DD D D :0 D 0 0 D 0 D DD D D D 0 MUD D 0 D D 0 D UU D D D UD D D U 
D D D D D D 8038600000000000——i38600000000000000 שא‎ 
O00000000000000000000000000000000000000 TEL 
U U D 0 DD 0 D 0 DDD TH 

U DU D U D U U D D D 0 DU 0 0 0 0 0 0 U 

void flush cache 811[] void] ; 
void flush tlb 811 void] ; 
U DU D U D D U D D D D D D D U D D 0 D D U D D D D D D D 0 D D 0 D D U D D U 
U U D D 0 U 


void flush cache mi struct nmstruct “nm ; 
void flush tlb nm] struct nmstruct *nmh|; 


U U U U በ D ፲ በ rmstrut 0 D D 0 0 D 0 0 0 D U D 0 0 0 0 0 0 D 0 0 0 0 U 


U D D D 0 0 0 U 
flush cache range] struct nmstruct *nmunsi gned long start, unsigned I ong end] ; 


flush tlb range[] struct nmstruct *nmunsi gned long start, unsigned long end] ; 
000000000000000 


voi d flush cache pagel] struct vmarea struct *vna, unsi gned long address[] ; 


voi d flush tlb page] struct vmarea struct *vna, unsi gned long address] ; 
U U D 0 D U 
voi d flush page to ranfunsi gned I ong page); /] 0 00 i386 D 0 0 D 0 0 0 D DU 
በበበበበበበበበበበበበበቨበበማሣ 

U U D 0 በገዘ ገ D 0 D 0 D 0 D D 0 D 0 D 0 D 0 0 0 0 D D 0 D D D D 0 D 0 0 U 
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OOO00000000000000000000000000000 
00,00 6230000000 020000 1000 2000 3000 
U D DDD D D D D 0 0 01000000000 2000000 ה‎ 
OO0O000000000000000000000000 0260ቨ 000 
በ 01000) D D D D D 0 0 D D D D D D D 0 00 D D 0 በ 020000 0 0 0 
U U 
U U 
U U 
































01000 0ኗ2600] 000 200000 ה טס‎ 0000000000 
በ הסט‎ 00000000000000 30000000 Ox2000[] 
U D D DDD 000 DD DD flush pag to ram] 00000000 


U U 0 0 D 0 D 0 D D D D D U 
copy cow pagel] ol d page, new page, address[] ; 
flush page to ram] ol d page] ; 
flush page to rann] new pagel] ; 
flush cache page] vamaddress|] ; 





























free pagg] ol d pagel] ; 
flush tlb page] vna, address[] ; 


UD 1 


0x2000 





0x2600 


ከ >> םה‎ j 
םםםםםם‎ 





082000 





םםםםםם 
QO00000000‏ 062 


449000000 


U D D D D 0 0 00 include/asmpttable. h0 D D 0 D 0 0 12601 flush 11ክ)[ 


םםםםםםם 
#lefine flush tlH] []‏ 
do +‏ 
unsi gned int tnpreg;‏ 


-247 — 





























Ol Linux [ Ul 


























asm X voletile |] 
"nol %er3, 99; #flush TLB An" 
"novi 56, 5663 In" 
: "a" [] ture] 
: "nenory"[] ; 
ን while 9 0] 
םםםםםםםםםםםם‎ መበበበበበበበበበ[በ፤ሀ B0000 


םםםםםההה 68 


681 00000 


በ clone()[] [] ] Ü U Ú‏ םםםםםםםםםםםםםםםםםםםםםהם 
በገ][በበበበበ በ በበ በበገገበበበበበበበበገበበበበበበበበበበ[;በ[በበ‏ 
OOOO task struct) D 0 0 0 D 0 0 0 0 0 0 D 0 0 0 D 0 D D meg 0000‏ 
በበበበበበበበበበበ[በበበበ task strut O0 ü ü ü d UU B U D DD 0 0 DI‏ 
HOD task struct OOOO‏ 1 1 הההה task struct‏ 
U 0 D 0 DD 0 በብ ።መዉመበበበበበበበበበበበበበበበበበሀበበበበ[በ[በ[በበ[[‏ 
10 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
624000000000000 םםםםםםםםםםםםםםםםםםםםםםםםם 
utt‏ 


[] 
[] 
[] 
[] 











Ser] 
מ לה‎ 
file 数据 
፳9 
子 进 程 的 


HER | | 


062 00000000000000 


U U 0 U D U 0 0 0 0 0 0 0 0 0 U D U U D U 0 U vmarea struct [OD UU D U 
00 nmstruct U 0 0 0 0 D 0 0 D 0 D D D U D 0 0 0 0 U 00 D U D 0 0 0 D 0 0 DD 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 
םםםםםםםםםםםםםםםםםםםםםההאםםםםםםםםםםםםםםם‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U DU 0 U D 0 0 0 U 
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מםםםםםםםםםהםםםםםםםםםםםםםםםםם 

00.0000000 kernel thread) 0000.0 kernel 90 D UO D 
በ 0 00 DD D D 0 0 0 DD D DD D 0 D 00 D pam NLD 0000000 
U uuu 


U D D fork) 0 ה‎ DDD DD DD D 0 dfek0D OU D U 
[] kernel / fork. d 
Ü * 

* (k this is the nain fork routine. It copies the systemprocess 
information [] task nr]|] and sets up the necessary registers. It also 
copies the data segnent inits entirety. ‘The "stack start" and 
"stack top" argunents are sinply passed along to the platform 
specific copy thread] [| routine. Met platforns ignore stack top. 
For an exanple that's using stack top, see 
arch/ i a64/ kernel / process. c. 


























* * XX * + 


*/ 
int do fork unsigned long clone flags, unsigned long stack start, 
struct pt regs “regs, unsigned long stack size] 
{ 
int retval; 
struct task struct xp; 
struct conpl etion vfork; 


retval = - FPERM 


/* 

* QOS PIDis only allowed for the initial SM svapper 

* calls 

*/ 
if [ clone flags KAW ADJ] + 

if [ current- pi d] 
goto fork out; 
} 


retval --FNMM 
p = 811 0ር task struct] [] ; 
if (] !፲፲] 

goto fork out; 


*p =*current; 


retval =- FAN N 
/* 
* Check if ve are over our maxi mm process limt, but be sure to 
* exclude root. This is needed to make it possihle for login and 
* friends to set the per-user process limt to sonethi ng I over 
* than the anount of processes root is running. -- Rk 
*/ 
if [] atonic read] Sp >user- processes] >= ው liniRIMT NO. rl i mcur 
&&: ! capabl e] CAP SYS ADMIN] !capabl ef] CAP SYS RESO REF] [ 
goto bad fork free; 
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atomic ind] Sp >user-> count[] ; 
atonic inc] Sp user- »processes[] ; 


/* 
* Counter increases are protected by 
* the kernel lock so nr threads can't 
* increase under us [] but it nay decrease] . 
*/ 
if [ nr threads >= nax threads] 
goto bad fork cl eanup count; 


get exec donain] p “exec donai nj] ; 


if [] p i nf mi S&p sbi nfnt- 209001 ef] 
. MDINC USE GIN] p sbi nfnt- modul ef] ; 


p- "did exec = 0; 
p >svwappabl e = 0; 
p state = TASK UN NERRPI BE 


copy flags] clone flags, p] ; 
p- pi 6 = get pid] clone flags] ; 


ው un li st. next = NIL 
ው rm list. prev = NIL; 


pæ cptr = NIL; 
init veitqueue head] Sp ait chldexit[] ; 
p fork done = NIL; 
if [] clone flags & ANE OK] + 
p fork done = &fork; 
init conpl 8109] &fork] ; 
› 
spin lock init[] &- “all oc lock] ; 


p- >si gpendi ng = 0; 
init sigpendi no] Sp >pendi ng] ; 


p it real value pit virt value =p->t prof value = 0; 
p it real incr =p åt virt incr = pit prof incr =0; 
init tiner[] Sp “real tiner[] ; 

p->real_tiner. data = [| unsigned long] p; 


p A 08002 = 0 /* session leadership doesn't inherit */ 
p->tty old pgrp = 0; 
p >tines.tns utine =p “ines. tns stine = 0; 
p ሟ1 nes. tns cutine = p- +1 065. tns cstine = 0 
#fdef CNIG SM 
1 
int i; 
p- >cpus rumable = 1; 
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D “processor = current- >processor; 
/ቾ 27 should we just nenset this 77 */ 
for] i = 0; i «snp mmcpus; i+] 
p “per cpu utineli] =p er cpu stine[i] =0; 
spin lock init] & >si gask lock] ; 
} 
Hendi f 
pA ock depth = - 1 /* -1 = no lock */ 
p sstart tine =jiffies; 


INT LIST HAD] & ב‎ ocal pages] ; 


retval =-ENMM 
/* copy all the process infornation */ 
if [ copy files] clone flags, p0 0 
goto bad fork cl eanup; 
if [ copy fsU clone flags, HU D 
goto bad fork cleanup files; 
if [] copy si ghand] clone flags, p0 O 
goto bad fork cleanup fs; 
if [] copy mëi clone flags, pO 

goto bad fork cleanup si ghand; 





retval = copy thread] 0, clone flags, stack start, stack size, p, rell: 


if J retval [] 
goto bad fork cleanup nm 
p >senundo = NII; 


/* Qr parent execution donain becones current domain 
These nust natch for thread signalling to apply */ 


p- parent exec id =p >self_exec id; 


/* ok, nowve should be set up.. */ 

p >svappabl e = 1; 

p exit signal =clone flags & ON, 
p >pdeath signal = 0; 


/* 
* "share" dynamic priority betveen parent and child, thus the 


* total anount of dynamic priorities in the systemdoesnt change, 
* nore scheduling fairness. This is only inportant in the first 
* tineslice, on the long run the scheduling behaviour is unchanged. 


*/ 
p >counter =[] current->counter +1] > 1; 
current- >counter == 1; 
if [| ! current- >counter[] 
current- 2need resched - 1; 


/* 
* Ck add it to the rum queues and nake it 


* visible to the rest of the system 
* 
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* Tet it rip! 
*/ 
retval = p pi d; 


p gid =retval; 
INT LIST HAN] &p- thread group] ; 


/* Need tasklist lock for parent etc handling! */ 
wite lock irq] &asklist lock]; 


/* GONE PARENT and CLONE THREAD re-use the old parent */ 
D >p opptr = current- 5p opptr; 

p >p pptr = current- >p pptr; 

if D ![] clone flags &[] GONE PARENT | GONE TRØAN OO + 

D >p opptr = current; 
if D ![] p trace & PT PIRXED D 
p >p pptr = current; 
› 


if [] clone flags & ANNE THREAD | + 

p gid = current- t gi d; 

list add] Sp >thread group, Seurrent- “thread group] ; 
} 


SET UNG H]; 

hash pid] pl : 
nr threads44 

wite unlock ird] &asklist lock]; 


if [] p >ptrace & PT PIRACED] 
send sig] IGI®, p 10; 


wake up process] ፲[] ; /* dothis last */ 
-Htotal forks; 
if [] clone flags & a ONE OK] 

wai L for conpletion] &fork] ; 


fork out: 
return retval; 


bad fork cl eanup nm 

exit nml gpl]; 
bad fork cl eanup si ghand: 

exit sighand] H|; 
bad fork cl eanup fs: 

exit fs] p]; /* blocking */ 
bad fork cl eanup files: 

exit files] d]; /* blocking */ 
bad fork cl eanup: 

put exec domai n] p- “exec donai n] ; 

if ] p גב‎ nf S&p sbi nf nt- 2nodul ef] 
. MD DC USE GINI] p sbi nfnt- 2nodul ef] ; 

bad fork cl eanup count : 
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atonic dec[] &- >user- »processes[] ; 
free uid] p-»user[] ; 
bad fork free: 
free task struct] gl: 
goto fork out; 
› 


OO fork] םםםםםםםםםםםםםםםםםםםםםםםםםםםםהםםםםה‎ 
do 0 ה‎ D D 0 0 DD D D DDD 0 DDD DD D D 000 DU 

በ11[[100[[0በ0-፳0ቹ፳፳]1[:[ 0 D task strup D D D D D D 0 0 0 D D 0 U 
000 clone flags 0000 GOE DDD D D D D D 0 000 D -E 0 0 D 
aoc DDD D D D D D D 0 0 D 00 D 100000000000000000000d 
בםםםםםםםםםםהם‎ task strut D D D 0 0 0 D D DD nd) DD 000 0000 
U U 0 U D U 0 0 0 0000000000 U 






















































































OO alloc task strut 00 0 D 0 0 0 0 0 0 D D 0 0 0 D 0 DDD 0 DDD D D D 
task ה‎ 000000000000000 

*p =*current 0 0000 task struct 0000000000000‏ םםםם 
O0000000000000000000000000‏ 

[ task struct [|| D D በ በ በ በ ver ሀ ü በ በ በ user struct ה‎ 0 DD 00000 
O000000000000000000000000000000000000000 
םםםםםםםםםהםםםהםםםםההההצש םםםםם‎ uer struct [] D 00000 
U D D DDD DU cowtI0000000000000000000000000000 
000000000 task strut 0 ] user] 00 0 D [1 0 task strut DD D 0 D በ 
uj መ D | DD 0 D 0 0 0 0 D 0 D በ በ በ በበ rlirRIMTNROQOOOOOOOO 
O000000000000000000000000000000000000000 
O000000000000000000 םב(‎ 

O0000000000000000000000000000000000000 
OOO00000000000000000 max threads] 000000000000000 

U D DDD DD DD DDD DDD DDD" 000” Dn D D D D 360000 
በ האא‎ D'0DDDDD DU iB2N D 0 0 0 UD 0 (D 0 0 0 0 D 000 Solaris 
U DD DDD DDD DD DD Staris) 00 en 21A 29T 0000 D nme 0 DD D D D 
000000 Dms D D D 00 task struct በ OOOO exec domm) D 0 [] exec donan 























በ] D OÙ exec donan[] D 000000 nodul eff 00000 dden D J 0 D OÙ D nux 
U DU D D D D 0 0 D D D D 0 D D 0 D D D D D D D D 0 D 0 D DD 0 0 D D D 0 0 D 0 U 
ם‎ 46 D D IU D D 0 0 D השפ‎ DD 00 0 D D 0 D DD D D 0 DD 0 0 D D 
get exec donain(p- “exec donain)[] הד ה‎ O0 nodleQ | [| [| [| Ú 

D 0 elt D 0 D u‏ 0 א םםםםםםםםםםםםםםםםםםםםםםםםםם 
በ] Java [I0O00000000000000000000000000000000‏ 
ה task struct [] [ LLL] L] L]. linux binfm JOOOO brt] MDIN (SE GINI]‏ 
םםםםםםםםםםםםטםםםםם 
D 0 TÆSKINNERPIIHE D 0 B U UH‏ 0 0 םםםםםםםםםםםםם 
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get pd00 0000000000000000000000000000000000 
copy flags [DOO clone flags] NO 000000000000000 plagg] 
get pid] DD D D 0 clone flags 000 GOEADOOOOOOOOO GOOD) 

D pid UD DDD U pd 

task Struck D D D 0 D D D D 0 0 DDD D DD DD 000 0 U‏ םםםםםםםםם 

task strut D D D D D D U‏ םםםםםםםםםםםםםםםםםםםםםםםםםםהם 

OO start tie DO 000 DD DD UD 0000 jiffiesN DD D D 0 D 0000 D 0 U 

በ D D [0 0. 0 local, pags JO0000000000000000000000000 

U U U 
copy files) D D 0 D 0 D 0 D 0 DD DD 0 D 0 D 0 D 0 D D 0 0 0 0 0 0 U 

cl one flags 0 D CLONE HIEST D D 00 0000000000000000000000 

0000000000 0 0 Dtask struct D 00000 files DDD fiel_structQ D D] 

000 O0000000 ttyOQOO0000000 300000 stdinstdou [| stderr 

U U U U U U D 0 0 0 0 U 00000 U 
copy TSL) D 0000 clone flags 0 0 GB 0o00 0 D 0 D D 0 D 0 U 

task struct D D 0 D 0 ם‎ fs struct NON OO [fs א‎ 0000000000000 

root 000000 pe] 0 D D D D 0 D 0 D 0 D wash J00000000000 

copy_sighand] D 0 D D D D aae SIGAND 00 D 0 0 D D 0 D D D D 0 0 0 D D 0 U 

U U U 
U U U 
U U U 



























































U U U U በ] D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 0 U 
በገ [በ በ U U D 0 በ በበ D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 0 U 
םםםםםם‎ task struct O00000 sig JOD signal_struct OOO 
incl ude/ Li nux/ sched. 8 DD DD 0 BD 0 D 0 D D D DDD D 0 0 
U D D DD 0 D copy m) 00000000 task struct 00000000 
חא‎ D D 0 0 0 በ በ D D D D [] mmstrut D D DD nmstruct D D D D 00 clone flags 
OO הטנס‎ በበ 00 D D D D D DD D DD 0 D 0 0 D D D D DD 00000 DD 0 U 
U U U UD struct D D D D 0 0 0 D 0 0 0 0 D 0 0 0 D U 0 0 0 U D 0 0 U D U D 0 U 
U D D 0 D 0 DDD vmarea struct D D 0 0 D D D D D D D 0 D 0 D D D D ጩጩ) 
U U U 0 U U 































































































በ D DDD task struct D D D D D 0 0 0 D D D D D D 0000 DD D D 0 00 0 U 
00000 copy thread] D 0 D H D በ ወጩ threadf הוה‎ D 0 D 0 D D DU D H 
arch/1 386/ kernel / process. c D D copy thread] D D D 00 D D D D 0 DL 
000000000000000000 םה‎ D D በ 0 DD D D ሀ copy thread] [] 
O0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
OOO0000000000000000000000000000000000 


parent exec id] [l| D D ፲ D 0 Up self exec ה‎ 0000000000000 
svappable ה‎ D D D D D D 0 0 D exit signal 000000 estOOOOOOO 
U D D 0 0 0 00 D pdeath signal 000000000 eit0 DDD 0 D 000000 U 
U OO counter | 0 D D U D 0 0 0 D 0 0 0 0 D 0 0 0 D U 0 0 0 U D 0 0 U D U D 0 U 
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OOO000000000000000 
OOO000000000000000 task struct 0000000 thread group 
U D D DDD 00 D D D D D D 00 00 thread D D D D D DUD D 0 D D D D thread 
U U 0 U D 000 U 

U U U U D U D 0 0 00 0 000000 U DU 0 U D U 0 0 0 000 0 00 0 00 U 
OO SE HMS D D D D task struct D D 0 0 DDD D D D D 0 000 DD D U 
በ DD hash PAO D D D D D n dD 00 D D D D 00 DD DDD D 0 000 D በ D DU 
00000 wke up ה א‎ D D 0 0 DON D 0 0 D DD D D 0 D 0 0 0 D D 0 U 
U D DD 0 0 0 0 D D DDD 0 0 DD D clone flag] GOE םחה האס‎ 100 
OOO0000000000000000000000 execve מםםםםםםםםםםה ה‎ 
000000 መ!1(110[00 UD D D D D D 0 0 0 0 D UD 00 0 wit for conpletion 
U DD DDD DDD DDD D 0 0 00 DD D D 0 GO VO םהה‎ 100000000 
U D U 0 0 D 0 D 0 U 0 D በ ሀ U D struct |] וה‎ 8 











































































































U DD DDD 00 DD DD 000 DD DD D 0000 DD D D 0 0 0 OOOO Ufork() 
OO0O00000000000000000000000000000000 forkOo D D 
U U 0 U 0 000000 000 ቨ ሀ U 



































682 OOOO 


በ NSX D Ol Dn J0O0OO0000000000000000000 
shel lD D D D D D D shell 0000000 shell NG PAMQOOOUOOO 
በገ] [በ በበ U D 0 0 0 D U 0 0 0000000 00 0 [በበበ U 0 U DU 00 ሀ; 
shell 0 0 0 D 0 D D D D 0 0 shell 0000 fok DDD DDD 000000 U 
בםםםםםםםםםםםםםםםם‎ sell COCOON 


UD 
U U U 
U U U 
U U U 


























U U U U U U D 0 0 0 በበበ 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
האתםםםםם‎ 00 0 0 0 D 0 0 0 D 0 D D U התא‎ a ot) I D D I በ 0 Li m [|] U 
በገ] [በ U D 00 0000000000 U 


10 ፳፻በ[ D 0 ቨ ሀ 
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8፻0"“00000000”"0000000000 9068፳ከ00000000 ፲መጩ 
000000000000000000 a. out 
p Ben D 000000 RED HD00 0 ELF 00000 
00O0000000000008F00000 e ident LP 
000000000000000000000 Sec? ו‎ 
000000000000000000000 SE 2 
000000000000000000000 
O00000000000000000000 +” de 
DDD Dg 68532 

000000000000000000 p_mensz 68532 y 
00000000 םםםםםתא‎ E Mm 

#incl ude «stdi o. h> p offset 68536 

000 p_vaddr 0x8059BB8 

min 00 D mens: 4:48 

1 p_flags PF_R,PF_W 

printf] ^ 18110 wrld!\n” [] ; በበ 

/ 0 0 

በ 625000000000000000 
as 0090ሀ000ዉ0 0000ወ፻0. © 00029 500900090 
0000000000 3000 EO Lo’ F በበ0000000000«9መሠብ 
םםםםםםםםםםםםםםםםםםםםםםםםם‎ EFODOD007000700 
םםםםםםם‎ DD De העשת‎ DH DH 0 00 0 0 00 00 DD 0000 8#ሠመ፲ጠ 
00000000000 00000 00 e ወመ D D 0000 00 0000 00 
000000000000000000000000000000000000000 

000000 88ጩ0በ00000000000000000000 10 p flags 
00000 PX) PR00000000000000000000 20000000 
0000000000000p offset 000000000000000000000 
p vadér D በ 0000000000 በ0 p 81መ50 pres2000000000000 
0000000000000000000000000000000000000000 
00000000000000 06530000000000000000000000 
0000000 œ6830 000000000000000 Coo print? 00000 
በ HFO0O00000000000000000000000000000000000 
00000000000000000000 2%0000000000000000000 
8፻0000000 208000000000000 

000000008ጩ00000000000000 ואפ‎ 0000 fork OD 
0000090000000ሀ800000 ee (OD D D DD DD D DD execQ ከ DnexecO 
0000000 ፳፻0000000000 8፻000000000000000 HFD 
0000000000000000000000000000000000000000 
0000000000000000000000000 8190000 f com DD D D 
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u 00000000 ጠበበበበበበበበበበበበበበበበበበ[በበ[በ[0በ[በ[በ0በ.[ 
በገ] DU D 0 0 Bp D 0 0 0 0 0 0 0 D 0000 DD 000 0000000000 U 
OO000000000000000000000000000000 REPDHUDHUDUDU 


2000000 shell OO 


በበበበበ ገገ በበ በበ sell 0000000000000000000000 
$1s -1 /usr/bin 


DU D DO /usr/bin D D D D D 0 D 0 0 D Dhel DD 0 0 D D 0 DDD 0 DD 0 0 0 
በበበበ[በበ/87815100በ0በበበበ00በ0በ00[0በ00 sell DDD 00 D 000 0 
000000 3000000 1s0-10 /usr/QOO000000000000000000 
U uuu 
םםםםםםםםםםםםםםםםםםםםםם‎ CD DD DD D D መጃ 1000 U 


000000 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם 
int nain] int argc, char “argv[ ][]‏ 


ב æg] OD‏ םםםםםהםאנועת םםםםם םםםהםם 
םםםהםהההההה /usr/binQ D D arv)‏ הפ 100-100000 argv[‏ 

በ D D 0 00 arg3l0 התא‎ 
0 CD D D 0 D 0 םםםה0פאא‎ 30000000000000000000000 


OO main )O000000 
int nain] int argc, char *argv[], char *envp 10 


envp[] U D D 0 0 0 D D D D D D 0 0 0 D U 
VAR NAME-sonet hi ng 


םםםםםםםםםםםםםם >= י"םםםםםםםטםהםהההאאאםםםם 
מםםםםםםםםםםהםםהםהםשא U U emp U U D U 0 0 0 0 D 0 0 D U U D D‏ 
execve( 10 DDD 0 U‏ בםםםםםםםםםםםםםםםםםםםםםםםםםםםהם 
U U U U U‏ 
OO00000000000000000062600000000000000000‏ 
NLD 0 0000 U‏ םםםםםםםםםםםםםםםםם 



























































PAGE_OFFSET 
env_end 





env_strat 











arg_strat 
&envp[0] 
&argv[0] 


start_stack 
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El El ES] 





ELSE 
ELLE 


ELE 
aa 


o 











Ez EE EE EEE PENE EL EECH, E=]; EL FE] 


EL EE) Or EGG. EC EI ET ELE EL EN EL EE) 
EI ELLE EIERE EELER EET EZ E 
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void nain] void] í 
U U U U 0 U U U 00 0 U 0 0 0 U U D D UD 0 D D D 0 D D UD U D D UD U D 0 0 0 D 
U 0 0 D 0 DD אא‎ 1000000 CD 00000 אא‎ 1000000 U 
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0626 0000000000000 























U U U U U D U D 0 0 00 0 U DUDU U 
[] በገ በ D U 0 0000000000 U 
[] በገ U በ ] ND UND ND NDN 
[] በገ በ D U 0 0000000000 U 
[] 
0 


CDD U‏ םםםםםםם 









































C0 D 0000 DDD DD 0000 U‏ םםםםםםםםםםםםםםםםםםםםם 


U U U U 0 U D U 
םםםםםםםם‎ 
בםםםםםםם‎ 






































אשםף םםםםםםםםםםםםםםםםםםםםהםם 
50000000 םםםםםםםםםההאים 00000 
םםההנטעו הנא 0100000000 በ lib] D D D‏ 


OOO00000000000000000000 




















OOOO0000GC0Q0000-stticJIOOO00000 


OOO00000000000000000000 
O0O00000000000000000000 
OOO000000006nkQ0000000 HR 




































































[] 
[] 
0 
[] 


ET ETE E) 
הי‎ EL EE? 


00000 BED D 0 0 D D 0 D 0 0 0 0 0 DH me U 
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D0000000 הה ההא‎ U H Ild. so. ቭ] 111ከር. so. 1 [] 1 011፲: so. 1[] 














683 0000 


በበበ fokO 0 00 DD DD DD 0 0 D 0 D 0 DD 0 D DDD DD DD 0 0 0 
O000000000000000000000000000000000000"0 
OOO00000000 execve00 000000000000 0 execve00 10000 
OO000000000000000000000000000000000000 
U D D 0 D 0 D D D 0 0 DDD D በ60 Pagei ng Load ng] (] D D ( D D] 0. D 0 0 
U D 0 0 D 0 D 0000 DDD DD 0 D 0 D D incde 0000000000000 
U D 0 0 D 
OO 11፳፳[ [ U U D 0 ሀ ling binfnt D D ቨ D] D] [ሀ /include/linux/ binfnh. hf] [] 
םםםםםםםםםםםםםםםםםםםהם‎ Dn" በ መይ()በበበበበበበበበበበበ 
linux התא‎ DD DD 0 በ1በ1በ111111[1:101[0101 1 0 01 2 
በበበ bmx bi nat [000000000000000000000000000000 
OO00000000000000000000000000000lins bina ood 


በበገ]በበበበበበበበበበበ 627000 
struct linux binfni + 
struct linux binfnt * next; 
long *use count; 
int [] ግ 080 binary[][] struct linux binprm*, struct pt regs * regs] ;/* 00000 


























0 
0 
U 
[] 
[] 
[] 








E=J EZE? 





























O */ 





int D *loadshlibjQint fd], /*00000% 
int [| “core dunm]([] long signr, struct pt regs * regs] ; 





formats lnux binfmt linux binfmt linux_binfmt 
=== next next ፡ጩ next 
use count use count use count 
*load_binary #load binary #load binary 
*load shlib *load shlib *load shlib 
*core_dumpQ #core dump) #core dump 














በ 627 limx binfm (0000 


U D DD DDD DDD DDD D vodbintm setup] D DDD D ü D D DDD DD D D 
םם םםםםםםםםםם‎ 0 D 0 D init elf binfnt()[] init_aout_binfnt() |] 
init java binfnt()[] init script binfnt()[] [] 

00000000 register binfni(struct linux binfnt * fm) ||| B] [| [] D] 


D D D በ በ በ በ በ *fornats[] D በ D ה*םם‎ DD 0 D l 
static struct linux binfnt *fornats = [] struct linux binfm *] NIL 


DOO000000000000000000 መበ 0 D 0 0000000 0000 U 
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U U 
load elf binary] struct linux hinprm* bprm struct pt regs * regs] ; 
static int load elf library] int fd]; 
OU elf font DD nn d D a d HU 
static struct linux binfm elf fornat = {#fndef MILLE 
NIL, NIL, load elf binary, load elf library, elf core dunp#el se 
NIL, &nod use count , load elf binary, load elf library, elf core dmp#ndif } 
በበበበበበ]በበበበበበበበበበበ[በ[በበበበ በ በ search binary hand ert 1 





OU 
OO00000000000000000000 linx bryr] 000000000 


U U UD D 0 00 000 U 
struct linux hi nprnf 
char buf[128];/*O O00000000*/ 
unsi gned 1 ong pagel MX ARG PAGES]; 
unsi gned | ong p; 
int sh bang; 
struct inode * inode;/*] DO 0000 * 
int e ud, e gid; 
int argc, evvc; /*10 000000 * 
chr *fileaw; /*0000000000000000000 * 
unsi gned 1 ong loader, exec; 
int dont iput; / * binfm handler has put inode */ 











L 
םםםםםםםםםם‎ 9 000000000 
Dn D D D D D D D execve(),0 D üCD B 0 ü ü ü ü DDD 0 DDD D D D 
D D DD 000000000000 [] execve()[]execlp()[] execle()[] 6800) ( [| execvpO ][ 
םםםםםםםםםםםםםםםםםםםםם‎ execve()[] U U 
0000 መይፎደንበበበ በ በ በ በ sys execveO [] በ 0 በ፲ D arck/i 386/ kernel / 
process. c[] 
1% 
* sys 66/89] [| executes a new program 
*/ 
asnhinkage int sys execve[] struct pt regs regs[] 
1 
int error; 
char * fil enane; 


filenane = getnanef] [] char *[] regs. ebx{] ; 
error = PIR FRA] fil enan®] ; 
if [| IS ERR] fil enane] [] 
goto out; 
error = do execve[] fil enane， char **[] regs.ecx, [] char **[] regs. edx, &egs[] ; 
if [] error = 0] 
current- trace & PT DING 
put nane[] fil enane!] ; 


return error; 
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U DDD DDD DD בםסנםםםםםםםםםםםםםםםהםםםהה הא‎ 
U U D D 0 DDD 00 D D 0 D 0 DD D 0 D D D 0 D 0 D D D DD 0 D D 0 0 D D 0 U 
getnane)] D D 0 0 0 D D 0 D D D D 0 0 D 0 00 0 0 D DDD DD 0 0 0 D 0 0 0 
do execve] D D 000000000000 do execver [ 0 00O fs/ exec. c [|] [| 
/* 
* sys execvel] [| executes a new program 
*/ 
int do execve[] char * filenane, char ** argv, char ** envp struct pt regs * regs] 
1 


























struct linux bi nprmbprm 
struct file *file; 

int retval; 

int i; 


file = open exec] fil enanef] ; 


retval = PIR ERR] filed ; 
if በ15 ERR] file] D 


return retval; 


bprmp = PACE SIZE*MX ARG PACES sizeof] void *[] ; 
nenset[] børm page, O, MX ARG PACES*si zeof[] bprm pagel 01][] O ; 


bprmfile —file; 
bprmfilenane = fil enane; 
bprmsh bang = 0; 
bprml oader = 0; 
bprmexec = 0; 
if [] [] bprmargc = count[] argv, bprmp / sizeof vid *[ ה ה‎ <Q + 

allowwite access] file] ; 

fput[] file], 

return bprmargc; 
} 


if QQ bprmenvc = count] envp, bprmp / sizeof] vid JOO <Q + 
allowwite access] file] ; 
fput[] file] ; 
return bprmenvc; 


} 


retval = prepare bi nprni] &bprrü ; 
if ה‎ retval « 0f] 
goto out; 


retval = copy strings kernel[] 1. &bprmfilenane, 680] ; 


if [] retval < OJ] 
goto out; 


bprmexec = bormp; 
retval = copy strings] bprmenvc, envp, &bprni ; 
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if [] retval <Q] 
goto out; 


retval = copy strings] bprmargc, argv, Em: 
if [ retva <Q] 
goto out; 


retval = search binary hand er[] &bprmregs] ; 
if [ retval >= 0] 

/* execve success */ 

return retval; 


out: 
/* Sonething vent wong, return the inode and free the argunent pages*/ 
allowwite access] bprmfile[] ; 
if D bprmfile] 
fput[] bprmfilel] ; 


for [i =0; i <MXAR PASS; i+ + 
struct page * page = bprmpage[i]; 
if [] pagel 
N . free page] pagel] ; 


return retval ; 


} 























OO filenane] arg] ewp D DD 000 DD D D D 0 0 0 0 0 D D D D 0 0 0 0 0 
U U U U 0 U D 000 U 

U U UU D 0 0 0 በ] 0 0 0 U D ሀ U ሀ በ UD በ open ee [T] D DU O O [open exec 
000000 Hiep 00000 DDD 00000 DD DD 00 0 

U U U U D U D 0 0 0 D 0 0 0 00 DD U D U 0 U D U 0 0 0 0000 00 0 U UD 
U D D DDD lin bon] D D 0 00 D D D D D 0 DD D D D D D D 00000 DUU 
በ በ በ በ MAR PARES] D በ በ 3200 0 ה‎ D D D D 0 0 D D D D D 0 0 ש‎ 

U D D D D br] D 0 0 0 0 D D D D D D børmp D 0000 DD D D 0 0 0 0 0 


00 bprmsh bang] D 0 D 0 00 0 D D DD 0 0 0 0 D D D Shell 0 JD Shell Sri pt] 
Ooo 00000000 Sell 1[በበበበበበበበበበመበበበበበበበበበ[[ i 
OO הפס‎ D D ፲ 0 በ ar ID 10 00000000 bprmp / sizeof(void *) 
DOO0000000000000000000000000 

OO comtOOO 0 D D 0 0 0 D D D D D foton D 0 0 D 0 DD D D 0 0 0 0 0 
0000 allowwite access] DD D D 0 D 0 D D D D D 0 0 0 0 0 D D D D 0 0 0 0 U 
OO0000000000000000000 prepare bi ncm DO bero] OOOO 
OOO0000000000000000000000000 1280000 linux binprm 
በበ 0 00 b0 DDD DDD 00000 DD D D 0 RPD DDD א‎ DDD D 0 U 
בםםםםםםםםםםםםהם‎ 28000000000000000000000 623 
000000 copy האגתמ‎ DDD D D D D 0 0 0 0 D D D D 0 0 0 D D D D bprm 




















— 262 - 

















[ Linux [] | 


cop strings kermel D DD DD 00 0 0 0 D D D D D 0 D 00 0 U‏ םב ם םםםםם 
መ nanet 10 D 0 0 D D D D 0 0 0 DH‏ 
OO0O000000000000000 search binary hander D D D nna 0 D‏ 
םםםםםםםםםםם 
search binary handler] [] D D D exec.co0000000000000 aphal‏ 


U U D D 0 0 0 D በበበ DD DD D D D DD D U 
/* 
* cycle the list of binary formats handler, until one recognizes the i nage 
vi 
int search binary hand er[] struct linux binprm*bprmstruct pt regs *regs[] 
t 
































int try, retval =; 
struct linux binfnt *fnt; 
6 4100] alpha 


/* kernel nodule loader fixup */ 
/ቾ so ve don't try to load run nodprobe in kernel space. */ 
set fs] USER IN] ; 
for D try; try2; tryHH + 
read lock] Sbinfnt lock] ; 
for [] fnt =fornats ; fm ; fm =fmi-met[] 1 
int | *fn[] [] struct linux binprm *, struct pt regs *[] = 
fnt- 3 oad binary; 
if 0 !ዖብ 
conti nue; 
if Q !try inc nod count] fnt- 20901 ef] [] 
conti nue; 
read unl ockf] &i nfnt lock] ; 
retval = fn] bprm regs] : 
if [] retval >= 0] í 
put binfnig fm], 
allowwite access bprm 411 8[ ; 
if [] børmi lej] 
fput[] bprm il eq ; 
bprm file = NIL; 
currert- >di d_exec = 1; 
return retval ; 





} 
read lock] Sbinfm lock] ; 
put binfntD fl ; 
if [] retval ! =- ፲፻ኮ1120፲1] 
break; 
if [] !bprm>file[] í 
read unl ock &i nfnt lock] ; 
return retval ; 
} 
} 
read unl ock Si nfnt_ lock] ; 
if [] retval ! 2- ENEXHT] 1 
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break; 





























#fdef COI G KMD 
ንጪ sef 
#efi ne printable] d] OOO ር] =\ םש‎ || በ በ dg ף || ה ש\=‎ 20s] d SSG d] «x7en D] 
char nodnane[ 20]; 
if [| printable] borm>buf[ OUT) S& 
pri ntabl d] bprm-buf[1]] && 
[91118 ef] bprm >buf[ 2] Eë 
pri nt abl ef] bprm >buf[ 310 O 
break; /* - ENCEXEC */ 
sprintf [| nodnane, "binfnt-%4x", * [| unsigned short * [] 
U &prm >buf[ 2](] D ; 
request nodul e] nodnane{] ; 
#endi f 
} 


return retval; 


} 
[| exec.cOH הה‎ DH B 00000 formats: 


static struct linux binfnt *fornats 
OO UfornmtsOO00 6270000000000000000000000000 
D 0 D D 0 UD do 0 0 0 D D DD DD 0 D D 0 D DD D DD 0 2800000 ጩጨ 
D 0 D DDD DDD DDD DDD D DD D D 0 D በሀበ ጩቭ D search binary hand er 
D DD D DD D 0 D D ה‎ [0000000000000000000000000 
U U D 0 D 0 D D D 0 D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 
U U D D 0 D D 0 D 0 DD D D D D D D 0 0 D 0 D D 0 0 D 0 DD D D 0 D 0 D 0 U 
forts] 0 D D 0 D DD 0 D 0 DD 0 DDD 0 DDD D 0 












































DD D D D D D D 0 00 0 U‏ 0 0 ה 0 Lor D D D D D 0 D‏ םםםםםםםם 
DD D D D D 0 0 0 0 D‏ 0 0 ה תת 01080 በ D D load binaryOO D 00 D D HD D‏ 
בםםםםםםםםםםםםםםםם ה ה( U D D DD 0 00 OD GOD D በበበ‏ 
OOO0000000000000000000000000 load binaryOD D D 0 0 D D‏ 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
D - ENEXHTJ‏ ][ 

U D D D D 0 D 0 DD foadbinaryOOOOOOOO000 -EXEXRTI D 0 D D] 
U U DU U DU00000000 D 00 U 0 D 00 UD 00 U 0 D 00 0 000 0 U 

















GUNT G השא‎ D 0 D 0 0 D D D DD 200 30000000 bam OOO 
request_nodule()0 D D D D D 0 0 0 D D D D D 0 0 D 0 0 D D D D tor D 00 D DU 
U U U U 0 U D U 0 0000000 U 

[| linux bn [000000 300000 0 load binary] load shib [| 
core dum] D [] load השאו‎ D D D 0 0 0 0 0 D D D D 0 0 0 D D D D D D 0 0 0 0 U 
ם‎ aoutQ D D D 0 D load aout. binary), EFO D D D በ D. በ load elf binary(), 
U D D 0 000 fs/binfnt aout. cf] በ fs/binfnt elf UD D 0 0 DD D D 0 D 0 00 0 U 

U U 0 U D U 0 0000 በበበ በበበ U D U DU D 0 0 0 D 0 0 ሀ በሀ ዘ ቨ በ U 























o9 
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GUD D D 0000 U‏ 0 0 0 האם םםםםםםםםםםםםםםםםםםםםם 
60sQ000000000000000‏ םבםםםםםםםםםםםםםםםםםםםם 








00000 80000000000000000d 
በገ] በ በ U U D 00 0 0000000 00 0 U D U 








U U U በበ] 0 00 0 0 0 0 0 0 00 0 000 U 
U U U በ U D 00 0 0000000 00 0 U D U 
U U U U U U D 0 0 0 0 U 00000 U 
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ססטםם ]111 


U U U U D U D 0 0 0 D 0 0 0 0000 U DU 0 U DU D U 0 U D 0 0 00 0 00 U 
shell D D 00 1000000000000 םםםםםםםםםםםםםםםםםת‎ 
U U U [በ በ በ በ በበ] በ 00000000 DU רת‎ 
Domm םםםםםםםםםםםהםםההה‎ QD D 00000 DD DD 0000 U 
OOO0000000000000000000000 Sstemvg םםםםםםהםהס:‎ 
Dot DDD D D 0 00 DD DD D D 0 0 ה‎ D 0 0 D D D D 0 0000 0 0 
OO0O0000000000000000000000000000 SysterV] IPC 
OO0000000000000000030000000000000000 Dom 
U uuu 
U U U U D U D 0 0 0 D 0 0 0000000 U 0 0 D U 0 0 0000 0 D 0 0 DU U 
U U 0 U D 0000000 U 






































vd "EE 


O0O00000000000000000000000000000000000 
O0O00000000000000000000 

e J000000000000000000000000000000 

e U UU UU UU DU UU DUDU U 
OOO00000000000000000000 
e [000000000000000000000000000000000000 
OOO000000000000000000000 
e [000000000000000000000000000000000000 
U U U U 0 U D U 0 0 000000 U 





















































ገበገ በበ U 0 D 0 0 00000 U 
U U U 0 0 0 U 00 0 000000 0 
U U D 0 D UU 0 0 U 0 D D D D U U 
U U U U DU 0 0 0 0 םםםםהאא‎ 


OOOO000000000000000000 
U pipe [000000000000000000 
OOO0O000000000000000000000 
OOO0O000000000000000000000 
OOO0000000000000000000000000000006nEQQ000 
O0O00000000000000000 300000000 

םםםםםםםםםםםםםםה תבהא 0000000000 e‏ 

















L1 
El 
L1 
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e םםםםםםםםםםםםםםםםהםם‎ 480000 gp[ 0 000000 
DOO000000000000000000000000000ØpQ00000000 
O0O00000000000000000 

e J000000000000000000000000 






































סםםםהה האתתם 71.1 


በ inx)0000000000000000000000000000000000 
U U U 0 [በ በ በ በ በ 0 0 UU በ በ 0 0 0 0 0 U 0 D 0 0 0 0 0 U 0 0 UU 0 0 0 U 0 0 0 U 
e I00000000000000000000000000 Limzx pano 
OOO 1000 48 000000000000000000000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ witeOD D 
םםםםאמיםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
*。U0O00000000000000000000000000000000000 
םםםםםםםםהםםםםם‎ red)000000000000000000000000 
read) םםםםםםםםםה ה‎ 
U U 0 U D 0000000000 0 U D U D U 0 UD 0 0 0 U 0 0 0 U D 0 0 U D U 
U U U U 0 U D U 


1000000 


በ inxJ00000000000000000000000000000 filed 
OO S00000 ፤፡ዐወመበ[በበበበ fileQOOO000000 םםםםםםהפט‎ 
0 םםםםםםםםםםםםםםםםםםםהפט‎ 71000 


L1 




































































































































































进程 1 进程 2 
filet files dá 
f mode mode 
፻ pos f pos 
f flags f flags 
f count count 
፻ owner f owner 
f inode f inode 
ያጭ inode f op 
f version —R f version 
private data private data 
数据 页 
Hue 
፣ 
Fis Se fEwrie 管道 读 操 作 read 

















0 71 0000000 
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םםםםםםםםםםםםםםםםםםםםםםםםםםה6ט 710000 0 

በበ U DU00000000 D 00 U 0 D 00 U D 00 U 0 D 0 0 U 0 00 0 0 0 U 

OO0O0O0O00000000000000000000000000000000000 
UD 


200000 


1100000000 fs/pipe.cOOO pire.cOOOOOOOOOOOOOOO 
00000000 הספת‎ 00000 pipewtieOQOOOOOOOOOO 
በ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםפפט‎ 
O0O00000000000000000000000000000000000 
U U U 0 D 00 U 
DOO0000000000000000000 םםםםםםםםםההשמ‎ 
םםםםםםםם‎ fileN 00 tlet NN ON NONONO 0 D 0000 U 
በገ በ ገበ 0000000 U DU 0 U D U D U 0 U D 00 0 00 0 0 00 U 
VSO000000000000000000000000000000000 
U U 0 U U U 00000 0000 DU 0 U U U 

םםםםםםםםםםם 






































o9 

፦ 

፦ 
o 
o 

















o 











ES EE EI ET =: Eg] GERE 
EET: EE E) 
L1 
L1 
L1 
L1 
L1 
L1 
L1 
L1 
Pye EZE EI 
CIE: ELE) 
































































































































O0O0O0000000000000000000000000000000000 
םםםםםםםםםםםםםהםה6ת‎ 


חםםםם 71.2 


DU D D 0 U בםםםםםהםםה0את‎ epnOD DH D HD UD p. eeOn D UO l B. D በ 

int pipe] int fd 2][] 

read)‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
በበ በበበበ በበ በበበ በበበ wite)I I0000000000000000 መሯ።()ቨ‏ 
በገ] U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 ሀቨ‏ 

få םס‎ 00000 read) D D D D በ 00 fd ה‎ በ D በ wite)I 0000 
םםםםםםם‎ fdoln fd D D 0 0 D D 0 tile D 00 D D D 0 D 0 0 0 ወመ()[ D 
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00000000 
OOOO ge [0000 
U 0 0 0000000000 U 
U 0 0 0000000000 U 
U D D D D fork()Q exec 
U LD 0 DD 0 DD DDD 0 tu 





























በገ] U D U D 00 000000 D U DU 0 U DU D 0 U 
O0O00000000000000000000000 
U U U U D U 0 0 0 U D uu 
םםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U D D UD D D D 0 መሄ8)0በ D D በ D D በ ፲ በ በ fork) 
םאס םםםםםםםםםםםםםםםםםםםםם‎ 
0 
U 
[] 
[] 





በገ] [በ በ D U D 0 0 0 D 0 0 0 0000000000 U 
U Uu 
OO0O000000000000000 lIseek)D O00 






















































































U U U 0 00 000 0 UD D 0 U DD 0 U U 0 0 D 0 (U 
# nclude <tdi o. h> 

#nclude «uni std. h> 

#nclude <sys/types. h> 
int main] void] 

1 

int fd[2], nbytes; 

pdt childpid 

Char string] = "18116, wrld!\n'; 
Char readbuf f er[ 80]; 
pi pe] fd] ; 

iff ף‎ childpid = fork) =-1[ 

1 


printf] "Error: fork'[] ; 


exit[] 1[] ; 
} 
iff childpid = 0] !* 0000000000 * 
1 
close] fd[ 0][] ; /በበበበበበ * 
witel fd 1], string strlen] string] [] ; 
exit[] O] ; 
el se /* 0000000000 * 


close! fd 1]0 ; ID D D D DDD v 
nbytes = read] fd 0], readbuffer, sizeof] readbuffer[] [] ; 
printf] "Received string: 96", readbuffer[] ; 
› 
return] 0]: 


O0O00000000000000000000000000000000000 
O0O00000000000000000000000000000000000000 
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U U D U D 0000000 U 
U U U U D U D 0 0 0 D 0 0 0 0000 00 U 0 U DU 0 0 0 000 0 00 0 U UD 


በ ₪0 ה‎ 0 D 0 0 D 0 D D 0 D 0 D 00 ONNLDGXTI [UC UU U U U U U 
#include <cntl.h> 





የ6810 fd, F SEIH, O NM GX] ; 


7.13 0000 (፳፻ 


Dom [0000000000000000000 םםםםםםםםההפאא‎ 
םםםםםםםיםםםםיםםםםםםםםםםםםםםםםיםםםם.‎ 
הא םםםםםםםםםםםםםםםםםםםםםםםםם‎ DDD 00 0 
U DD DDD 00 DDD DD DD HP OD D 0 0 000 DD DD 00 0 
אא םםםםםםםםםםםםםםםםםםהסאםםםםםםםםםם‎ 
O0O00000000000000000 
םםםםםםםםםםםםםם‎ shell D D 00 mod JO D 0 D D D 0 D 0 U 
nknod()[] OOOO 
n&knod()[] D D 0 D 0 D [] D 


E 121.1: 1:5] 


























#nclude <sys/type. h> 
#n cude <sys/state. h> 
Hnclude <cntl.h> 
#nclude ani std. h> 


int nknod] char *pathnane, node t node, dev t dev] ; 

OO pathnane D D D D D 0 0 D D 0 הא‎ D D D D D 0 D 0 0 D D D D 0 0 0 0 0 
בםםםםםםםםםםםם‎ SIAYA O dev D DDD DDD DD 000 DD DD D D 0 0 0 
םםםםםםםםםםםם‎ 0 

open)‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
םםםםםםםםםםםםםםםםםםםםםםםםםה(פ U D D D 0 0 00 DD D‏ 
DU D 0 DDD D 0 NONONO D reod 10 D D D 0 DD D D D D D 0 0 D wite) 0 [ በ‏ 
fentlOOO ONNIGOKI D D KO በ በ reod, 70 በ 0 witeODX D 0 ü ü D‏ 000000 


























0000000000000000 AAN 0000 
UOU0O0000000000000000000000000000070000 
በ11[000[00 HO0 D D D D 0 0 
U U U U D U D 0 0 0 D 0 0 0 0000 U D U 0 U DU 0 0 0000 0 0 0 0 DU U 
00000000000 wite1D 0000000000 ax] םםםםםהםהה‎ 
םםםםםםםםםםםהנאא םםםםםםםםםםםםםםםםםםםהםםםםהם‎ 
U U U U U 
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7.2 JO [] signal 






































































































































7.21 1111 114] 


i386000000000 200000‏ 3200 םםםםםםםםםםםםםםם 
400 640000000000 בםםםםםהההשאגתא 6400 320000 OO‏ 
Linx] D [| 13861] 320 0000 include/ asni st gnal. hD OOOO 710000000‏ 
U U 0 UD 000000 U‏ 












































[ 7.1 111100] 

U U 000‏ סםם 
SI GAP 0000000000000 1‏ 
SGN 0000000 ORG CO OG 2‏ 
SIGUT 00000000 cel cJ ü H 3‏ 
SIGIL በ000 4‏ 
SI GIRAP 0000 2‏ 
SI GABRT O000000000 abort DD D 6‏ 
Iar IGr0D 6‏ 
SI GUS 0000 7‏ 
SI GPE 0000 8‏ 
SIL 0000000000000 9‏ 
SI TERI 0000004 10‏ 
SIGSEGV N00 11‏ 
SI GBR2 U U 0000 s 12‏ 
SI ŒI PE 000000000 13‏ 
SI GALRM 000000000 14‏ 
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SI GIERM םםםםםםםםהוא‎ 15 
SIGHD םםםםםםםם‎ 17 
SI GOON םםםםםםםם‎ 8 
SI GIO 0000 19 
DO 
000 U U 000 
SIGISIP 000000 20 
SI GITIN 000000 21 
SI GITOU 000000 22 
SI VR 0000 30 
U DU D U D D U D D D D D D D U D D D D D U 0 D D D 0 D D D D D D D D U 0 D U 
U U D D D D U U D D D 0 D U U 0 D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 D 0 0 0 D 0 D D U 





























םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםשם 














U 20 D U 00 000000000 DD 000000 00000 00 0 000000 U 














































































































































































































































































































072 םםםםםםםםםםםםם‎ 
OO 7200000000000000000000000000000000000 
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OO0000000000000000000000000000000000000000 
O0O000000000000000000000000000000000000000 
OO0000000000000000000000000000000000000000 
OO0O0O00000000000000000000000000000000000000 
OO00000000000000000000000000000000000 




















7.2.2 11111] 


በ PØXOOOOOOOOOOOOOOSØA םםםםםםםהםםהםהםהםהא‎ 
םםםםםםםםםםםםםםםםםםםםםםםםםיםם"‎ 100000000000 
በበበበበበበበበበበበበበ በበ”በበበበበበበበበበበበበበበ[በ[በ[በ[በ[በ[[ 

CIRC DD DDD 0000000‏ םםםםםםםםםםםםםםםםםםםםם 
ጩመጣሣበበበበበበ[በ[በበበበበበበ SaNry D |‏ םםםםםםםםםםםםםהם 
בםםםםםםםםםםםםםםםהםהםהם ה 0 do‏ םםםםםםםםםםםםםהם 
םםםםםםםםםםםםםםםםהםהםהאצצ 0 CIRAC0 D D D D D D D D D D‏ 
TRE‏ 000000000000000 00 0 0 0 0 הא םםםםםםהםםםםםם 
DU DD DDD በበበ በበበበበበሀ 10000000000 20 SGNQOOOOOO‏ 
OO 20000000000000000001000000000000000000‏ 
በበበበበበ በበ በ 00 [በ በ በ በበ በበበበበበበበበ በ በ[በ[በ[[በ[በበ በበበ በ” በ‏ 
በ”ን በበበቨበበበበበበበበበበበበበበ”በበ”በበበበ[በበ[በበበበበበበበ‏ 
በ111በ1[በ1[በበበ U‏ 

Box በበበበበበበሀበበበበበበበሀበ[በበ[በበበበበ[ሀሸበቨ[በቨ[ 
kernel /signal .c[] 000000000000 

uuu U U 

int sigenptyset[] 51 0561. t *nask{] U D DD 0 0 D D D 0 በ ሸ 

int sigfillset[] sigset + *nask, int ₪ התהתהההההה הההה‎ 

int si gdel set[] 51 91. t *nask, int signum] חהחההםההההה‎ 

int sigaddset[] sigset + *nask, int signum] חההההםההההה‎ 

int sigisnunber[] sigset_t *nask, int signum ה‎ 00000000000000 
uu 

U D DD D DD D D D בםםםםםםםםםםםםםםהםםהההה ה טפ‎ 


OOOO kernel/signal.c(] D D 0 0 Ú 
int sys si gprocnaskf] int how sigset t “set, 510866 t *oset[] 


000 set NONONO NONONO D D 0 D 0800 bw D D 000 sel 
OO hw D D D D D D 0 0 

4081  5ההםםםםםםם‎ 

SIGUBOK בםםםםםםםםההה5%‎ 

SIG SETHOK set ה‎ D D 0 0 0 00 0 U 

















0 
U 
[] 
0 
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በገ] U 9101100900. 


swtch [] how] 1 
case TG HOK 
current- “bl ocked | = new set; 
break; 
case SIG WACK 
current- H ocked &= new set; 
break; 
case SIG SEIMSK 
current- >hl ocked = new set; 
break; 
default: 
return -E NAL 
› 
QO curent በ በ 1 በ D task struci 1 D 0 በ [ 
0 3000 םםםםםםםםםםםםםםםםםםםםםםםםםםםםהה א‎ 
םםםםםםםםםם‎ 


00000 40 ה‎ D D 0 D 00 D D D D 0 0 0 0 0 DU 


7.2.3 JUD D 
በበ ה0צ‎ D D 1] D DH ms D 0 D 0 D D D DD DD 0 0 0 U 
U U U U U U 
int si gacti on] sig, &handl er, Sol dhand er[] U טי‎ DE D 0 E] 
int sigreturn] Seontext[] U mauu 
int Sigprocnask int how 510508 t *nask sigset t *old] [000000 
U U 
int si gpendi ng] sigset t nask] 000000000000 
int kill] pidt pid, int sig] 0000000 
long al arm long secs] 000000 
int pause] void] OO0O000000000000 
DU sigset t [100 
typedef unsi gned long 51(ጅሟ t; /* OO 320 */ 
םםםםםםהםםםהםםםםם‎ 
Willogogg 


OOO00000000000000000000000000000000000 
OOOO000000000000000000000000000000000000 
OO00000000000000000000000000000R00O000000 
U U D 0 0 U 

int kill] pid t pid int sig] 
OO sigOOOOOOOOOOOO A00 000000000 D od 
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U U 0 UD 000000 U 
pdo OO sigh DD DDD 000 pid D DO 
269 OOO םםםםםםםםםסגא‎ p OOOO sig IU ከ 
pU U D 0 0 0 0 00 U 
pid=1 lma D DD 00 sig D D 0 0 DDD ist QO0000 
U U U U 0 U D U 
pid<1 DD DDD U -0d0 D 0000 U 
U DD םםםםםםםםםהםםםהםהסגא‎ 1:0 0 በ םםםםםםםםםםםאס‎ 
U U D 0 000 ID OD 


20 ause()[] alarnt)O OOO 


םםםםםםםהש בםםםםםםםםםםםםםםםםםםםםםםםםם 
0 0000000000000000000000000000000000 
U U U UD U U D 0 0 0 0 U 00000 000 U D U 0 U D U D 000 0 U‏ 
U U U U D U D 0 0 00 0 000000 U DU 0 U DU 0 0 0 000 000 0 DU U‏ 
UU D 0 D D 0 D DDD 00000 DD D D 0 DD D D D 0 0 D 0 alarm)‏ 
U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U 0 0 0 000 U‏ 
D D D D D D 0 0 0 0 DU‏ הש D 0 0 0 0 0 D‏ הא 0 ה SAM]‏ 00000 

D D 0 0 000 D DDD 0000 DD DU‏ העפאה 000 בםםםםםםםם 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםהםםםםהה הנאה 
OOOOO000000000000000‏ 
OOO00000000000000000000000000000000000 ex‏ 
OOO000000000000000000 darQ OO 30. JO0000000000‏ 
DO0O0000000000000000000000000000000000000‏ 
O0000000000000000000000000000000000000 መ‏ 
U U‏ 
U U‏ 

















































































































U D D D D 0 0 0 D paseQ00 0 000 DD DD 0 D 000 DD DDD D 0 000 U 
U D D DD 0 OW 


























מםםםםםםהם 724 


si gacti n0] D D D D 0 D D 0 D 0 D 0 DDD DDD 000 DDD D 000 D 0 U 


U U 
int sys sigacti on] int signum const struct 51 06ር11 on * action 
struct sigaction * ol dacti on] 
OOO sigaction[] 0 000 include/asnásignal.h[1[] | |) 11) D. U 
struct Si 08ር11 00 + 
__sighander t sa hand er; 
sigset_t sa_nask; 
unsigned long sa flags; 
voi d [] *sa restorer] [| voi d] ; 


L 
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QO sighander t [000 


typedef void [] * sighandler tf] [int[l; 
U D DD DDD sa hander DD DD 0 D D D D D sa vask D D D DDD DD D 
stomm! D D D D D D D D D D D D 0 0 0 በበ 0 DD DDD DD D 0 D DDD 0 00 0 0 
በ] [በበ ፲ በ Sa flags 000000000000 Q) D DDD 0000 0 0000 0 

SA NSO 0 D 0 0 D D 0 0 DDD DD DDD 0 0 

SA NMSK [I sigaction[] [| [] sa nask[] [] 

D nm D םםםםםהםהה‎ 300000 

#06[1 me SIG ÆL QQ sighandler 11 01] * ההת‎ H [በ [በ ”/ 

3611 6 SIGIGN[][] sighandler tq 10 *|11[[0[ [1 * 

Hdefine SIG FR [ | sighander t0 -10 *2 000000 * 

OOO ה(‎ 0000000000000000 


int sys sigaction] int signum const struct sigaction * action, 
struct si gacti on * ol dacti on] 
1 








struct Si 08611 on newsa, *p; 


if ] sigu || signumx32[] 
return -H MAL 
/* 000000 0 2000000 ሣ 
if [] signm=SI GALL | | si gnun=A GIG] 
return -H NAL: 
IAL] SSPOOOOOOOOOO ” 
p =signum- 1 + current- >si g- >acti on; 
XD D D D D D D D D ם ם‎ sigur] action DD * 
if [action] + 
int err = verify areal] VEN FY READ action, sizeof] *acti on] [] ; 
/*Q 00 acti onp 0000000000000 * 
if Q err[] 
return err; 
nencpy fronfis[] Snewsa, action, sizeof] struct sigaction] [] ; 
/ፆ በ actoinQOOOOO0000000000*% 
new Sa. sa mask | = 4] signunj ; 
[FOOD siga] OOOO ” 
if [ newsa. sa flags & ኳላ NMSK] 
new sa. sa mask & ~ g] signunl] ; 
/* 00000 SX NMSK] 0 0 0 siga 0000000000000 ሣ 
new sa. sa nask & HOKAHE 
!* 0000 SAL] ISIP ” 
if [| newsa. sa hand er ! = SIG IFL & new ssa. sa hander ! ጩ[(3 10%[ + 
err =verify area] VER FY READ newsa. sa handler, 1] ; 


*O000000000000000000 sigum] D 0 0 D D D D 0 DDD 0000 DD 0 0 
םםםםםם‎ v 


if [] err[] 
return err: } 
} 
if Holdaction] + 
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int err = verify areal] VERFY WTE oldaction,  sizeof[] ol dacti on] [] ; 
if [] err[] 
return err, 
nenepy tofs[] ol daction p, sizeof] struct si gacti on] [] ; 
L. s */ 


if J action] + 
*p = new sa; 
check pendi ng] si gnuni] ; 
› 
return 0 
T 
DH mes J000000000000000000000000000000000 
00000 sigactioO00000000000000000000000000 


7.2.5 00000000 


Unx םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםההה‎ 
U U U U D U D 0 0 0 0 U 00000000 U D 0 0 U D U D U 0 U D 00 0 000 U 
OOO000000000000000000000000000000000000 
U U U U DU U 
OOO task strut D D 0 D 0 D D 0 0 D D 0 D D 0 0 D D [በዐ Sga ከ 
U D D 0 DO Bocked]NN DDD D D 0 D 0 0 DDD D DDD D D 0 0000 D U 
U U U በ U U D 0 0 0 D U 0 0 0000000 00 0 [በበበ U 0 U DU 00 0 U 
םםםםםםם‎ SQL] םםםםםםםםםםםםםםםםההנהה5צ‎ 
00000 הפ‎ 0000000 task strut 00000000 
sigaction U D | በ በ] በበ በበ በ D 0 00 0 0 DD 000 0 0 D 0 DU 00 0 U 
OOO sigactio D D 00 0 0 DD D 0 D 0 0 0 0 D 0 0 000 0 0 D D 000 U 
በበ U U DU00000000 D 00 U 0 D 00 UD 00 U U D 00 0 000 0 U 
sigactio()D 000000 sigaction] DDD 00000 DD DD 00000 D U 























መፀበ ወፀበበቨበበበበበበበበበበበበበበበበበበበ[በበበ[;ቨበ‏ םםםםםם 
םםםםםםםםםםם 0 task structQ signal DDD D 0 0 DD‏ 00000 
1000000000000000000000000000000000000 
סםםםםםםםםםםההנהתטאאאאוםםםםםםםםםםםםםם 
בםםםםםםםםםםטםםםטםםםםםםםםםםםםםםהההה O RN NG]‏ 
U U U U U U 1011000000 U‏ 

U U U UU D 0 0 U 0000 U 00 D U U UU 0 0 0 U 00 D D U D 0 D 0 0 U U U 
OOO000000000000000000000000 signal O Hok 00000 U 
OOO000000000000000 sigaction [DO ה ה‎ 8 
U U 







































































U U 
U U 
U U 
U U 
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[] 


0 
[] 
[] 


0 
U 
[] 












































01000000 3መረመ[በበበበ[ሀ0[0000 SG SGP] 


םםםםםםםםםםם 


םםםםםםםםםםםםםםםםםתם 
םםםםםםםםםםםםםםםםםשם 
























































7.2.6 [UL 


O0O0000000000000000000 
O0O0000000000000000000 
Do በ FØXJOOOOOO00000000000000000000 
O0O000000000000000b0ked[OQO0O 
OO sigaction)0 D D በ D Hin 00000 0 
פםםםםםםםםםםםםםםםםםםה השס םםםםםםםםםם‎ 
אפםםםםםםםםםםםם‎ 0 00 0 0 U [] 





U U מים‎ D 00 0000 000 U DU 000 U 


U U U U 
U uu 
U U U U 
U U U U 


U utu 














O0O000000000 
םםםםםםםםםםם‎ 
U U U U 0 U D 000 U 
U U 


U U U UU U 000 U 
U U U UU U D 0 U 
































[] 
0 
U 
U U U U 0 U D 000 U 


U U U U 


03200 
U Uu 
U uuu 


bl ocked 
U uuu 
U U U U 
U U U U 
U uuu 


OOOO Ex D D D D D 0 signal 000 O00000000000000000 


በበበ ጃቋመበ()111[]1 በ] D [| 
#ncl ude «signal . h> 
få ncl ude «uni std. h> 


void [] * signal] int signum void] *handl er[] 9 int] [] ה‎ [] int[] ; 
signal )A || | 0 0 D DD DDD 0 D 0 D DDD 0000 DD 00 0 00 000 U 


000000000000 
#nclude <tdi o. h> 
få ncl ude <si gnal. h> 
få ncl ude «uni std. h> 


int ctrl c count ©; 
void [] * old hand erp 9 INI] ; 
void ctrl d]int[]; 


nai n() 


1 
int ₪ 


old hand er = signal ] SIGNE ር1፲1 di: 


while [] | c=getchar()Q ! ='ላቭ ך‎ ; 


printf] "ctrl-c count = Ga ,"ם‎ ctrl ር count] ; 


void] signal] SAN; ol d hand er] ; 


) 


void ctrl ር[] int si muni] 
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t 

U void] signal SIG N; ctrl dj 

-Hetrl c; 
} 
O0O000000000000000000000000000000000000 
0000000 ctrl ርበበበ TANOD SGNOOOOO ctrl C0 0000 0 
(עואםםםםםםםםםםםםםםםםםםהנאצשםםםםםםםםםםםםםם‎ 


OOO000000000000000000 
old handler = si gal | SIGNE ctrl di: 


signal OD D 0 0 D D D D D 0 D 0 00 DD D D 0 0 םםםםםםםהםההנאצצ‎ 
00000 תא‎ JO 0 DDD DD DD DD D D D D 0 0 Sgad (0 D 0 000 D 0 U 
םםםםםםםםםםםםםםהם‎ ode hand er] 0 D DD D D D D 0 0 0 0 0 D D 0 U 
U U 


L1 





OO000000000000000000000000SGNODOOOOOOOD 
םםםםםםםםםםםם‎ በ ር comt 00000000 SGNOOOOOOOO 
בםםםםםםםםהםםםםם‎ signal (OD D DD D 0 DO SGN] D ctrl cOO 
בםםםםםםםםםםםםםםםםםםהם‎ signal (0 DD DD DD 00000 0 U 
U U U UD U U D 0 0 0 0 U 0 0000000 U DU 0 U ሀ U 
































0 
U 
[] 
[] 


Oo 
























































7.3 SystemV [] IPC] [| 


Dm D D D 30 systemV DDD 00 000 DD 0 U‏ םםםםםםםםםהםםםםם 
OOOO senaphores] D D 0 D 0 0 H me 0 D 0 0 0000 D D D D 0 0 D 00 D D 0 U‏ 
SystemV IPE OOO0O0000000000000000000000‏ בםםםםםםם 
OOO0000000000000000000000000000000000000‏ 
O0O0000000000000000000000000000000000000‏ 
DD D 0 D 00 D D D D 000 DD DDD D 0 000 DU‏ הש D SystemV‏ 0 
mx 000 SystemVIPCN 0 0 0 0 D D D D D D B UD D pc per] OOOO‏ 0 


LCD D D D D D 0 D 0 ואו‎ hD D 0 0 D L 
struct ipc perm 
{ 


L1 

































































key t key; Jt ብ #7 
ushort uid; /X000000000000000000000000 v 


ushort gid; 

ushort cui d; *O000000000000000000000000 * 
ushort cgi d; 

ushort node; /* OOOO * 





ushort seq; /* 000 v 

TL 
በገ] [በ በ DDD 0 DDD DD eviñ D DD D 0 0 00 00 በበ 00 0 0 

U U U D DDD 0 በበበ በበበ በ በ በበበ D D D D D D በበ DDD D 00 D U 
በ SystemVIPC] D D D D 0 D D D 0 D D D 0 D DD 0 D GOOOO000000000 
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o00000000000000000 האפ‎ DDD DD 0 0 0 D DDD D DU 
U U 0 U D በ [በበበ በበበ በ9በ[ዐ 



































7.3.1 OOO 


EWHjkstrag 1950000000000000000‏ בםםםםםםםםםםם 
םםםםםםםםםההאתעםםםםםטםםםםםםםםםםםםםםםם 

[| D OG senaphore NN D D 00 D D DD በ D D ሀ D p 0 D ם‎ በ d testigo D OÙ set00 
םםםיםםיםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U 0 U D U 0 00000000 000 U UU 0 U D U 0 U D U D U 0 0 00 0 0 U 
U U 0 U D U 0 00000000 000 U 0 U 0 U D U 0 U D U D U 0 0 0000 U 


EI 





በበበበበበበበበበበ"በበበ O000000000000000000000 
O0O000000000000000000000000000000 
O0O00000000000000000000000000000000000 
OO000000000000000000140000000000000000000 
םבםםםםםםםםםם‎ 000000000000 400 1000000000 
000000 נבםםםםםםםםםםםםםםם‎ OGOO00000000000 
O000000000000000000000000000000000 1000 
OO0000000000000000-00000000000000000000 
00000000 100000000000000000000000000000 
በ ብበበበበበበበበበበበበበበበበበ[[ 100000000 
0000000000000000000000000000000000000 ag 
OO000000000000000000000000000000000 od 100 
O0O0000000000000000000000000000000000000 
0O000000000000000000000000000000000000Önk 
פםםםםםםםםםםםםם‎ 


םםםםםםםםת 


Enx םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםההה‎ 
U U U UD U U D 0 0 0 በበበ 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U D D D 0 0 00 DD include/linux/semh 0 D 0 D D D D D D D 0 0 D 00 D D 0 U 
U U U U 

0100000000000000 0 sen 


struct sem í 
int semal; /* 0000000 * 
int senpi d םםםםםםהםםםהםםםהנםםם!‎ * 
L 
02000000000000 set D በ በ ሀ ሀ semd ds] 
struct semd ds + 
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Linux [ 


/* LCD U 


























struct ipc permsemperm 











Long sem oti ne; /* DD DDD 0 DDD D D ההוש‎ ሣ 
long semcti ne; /* 00000000000000 a 
struct sem *sembase; /ፆገዝበበበበበሀበበበበበበበበበበ[ * 
struct semqueue *sempendi ng; *םםםםםםםה*!‎ 
struct semqueue **sempendinglast; /* 00000000 * 
struct semundo *undo; /* 0000000 החשש‎ * 
sem nsens: /* 000000000000 * 


ushort 
E 
D 37 D DD 0 D 0 DDD D [ በ በ D 0 semqueuef] 
struct semqueue 1 
struct semqueue * next; 
struct semqueue ** prev; 
struct wait queue + sl eeper; 


*/ 
, "D 4 prev] =q */ 


םםםםםםםם*! 


struct semundo * 
int 
int 
struct semd ds + 


status; 


undo; 


nd /* 0000000 
/* 000000 


sm; הםהן*/‎ 


struct sentuf * 

int nsops; 
bi 
04 0000000000000 

00 7300000 5989 ds በ D በ sembase ] D D D 0 D D D 0 D 0 D D D 0 D 0 
U D DD D D D D D 0 D D 0 D 0 D D D D OOOO000000000000000000 
00000000 se "םםםםםםםםםםהה‎ semd ₪ 0000000000 
U D D D 0 0 DD D D D D D 0 D D 0 D D D D D D DD 0 D 0 D D D 0 0 D D D 0 0 D 0 U 
00 7.3000 
Box J0000000000000000000000000000000000 
በበበበ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםי‎ 
U D D D 0 0 D DD 00 DD DDD D D D 0 D 0 D D 0 UD 


/*Q 
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信号 量 集合 
(sernid ds) 















































_ 


信号 量 数 组 











sem perm 
sem otime 











sem ctime 














sem base 














sem pendmg 


信号 量 集合 队列 


(sem queue) 








sem pemding last 





undo 


sem undo 
As d 











sem sans 





proe next 








id next 
semid 








semadj 








L 
next 


prev 








sleeper 





undo 
pid 





status 


sma sembuf 
sop ፦ 




















ከ5255 

















0 7.3 SystemVIFC] DDD 000 0 D DDD 


20 D D 0 senget () 


U D DDD 000 DD DDD DD D D 0 00 D 0 D D D D UD D D segetOO D D D Ú 


U U U 0 U U 


OOO int senget [| key t key, int mem int 5610 [] [] 
U DD [ገ]ገበበበበበ1]በበበበበበበ IPC D LU U 


000-000 


U uuu 


senget 0] 00 10 D 0 D D 0 D 0 000 DD DD 000000 DDD D 000 0 U 
OO00000000000000000000000000000000 selgi 0 


U U U U 


e ICRA D D 0 D D 0 0 0 0 D D D 0 0 0 0 D 0 000 0 U 


° םה באז‎ IC EXTD D DD D 
OO IPC GAT D D O D sengetOO OO 


U U U UD U D 00 U D 0 U 
U U U U 0 0 0 U D U 0 ሀ U 
U U U UD U D 00 U D 0 U 


U U U U DU U 





























U U U U 
#define 85881. 250 


U uu 


በገ SystemV LCD DD 00 D 0 0 0 U 





0 3000 nes D DDD DD D D 0 0 0 





U U U 
U U U 


OOO IPC RAO IPC RAM D 0 D DD D D D 0 0 0 
-10 IPC 50111በ00:[ D D D d IPC arp o D] Ú! 


U U U 





U U U 


በገ በ D U D 0 0 0 0 U D U 


[] 
በገ U D U D 0 0 00 000 U 
0 
0 


51. .בת‎ ELE 























U U 0 U D U 0 00000000 U 








U D D DU D 0 D 0” linux/semh” 


/* <8 000 nax numof senaphores per id */ 
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U U U U D U D 0 0 U D 0 0 0 0 U D 0 0 U U rses 0 D I DD DU 


םםםםםםם 
int open senaphore 561[| key t keyval, int nunsens []‏ 
{ 















































int sid; 


if [] ! nunsens [] 
return] - 10 ; 


iff 0 sid = senget[] keyval, nunsens, IPC GREAT | 0660 [] [| = - UI 
1 


return] - 10 ; 
} 


return] sid] ; 
} 


06600Q0000000000000000000000‏ םםםםםםםהםםםםם 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםנ-ם 
U U U U‏ 


3070000: 59ሀጩ() 


O00 int 56099 [| int semd, struct senbuf *sops, unsigned nsops[] ; 
OO: םםםםםםםםםםםםםםםם‎ i 
000-100000 
ה(‎ 00 10000 semd 00000000000 90 בםםםםםם ה ה‎ 
0 20000 soms DD OD D 0 0 DD 000 0 0 0 D 00 30000 mol 
U D 0 0 00 D 00000 U 
sos D D D በ D በ በ senbuf D (] D D D D 0 D D በ በ /inclide/linux/semh NOOD 


U U U U 000 0000 0000 0 በ 
struct senbuf 1 


ushort semnum /* 00000000000 * 
short semop; /* 0000000000000 © * 
short semflg /* 000000 IPC NWT] SEMUNDDY 


E 
OU semop D በ D D D D D d D D በ በ | | በ sewmopp DD DB D UO UO D D D D DO U 
OOO000000000000000000000000000 IPC NAT DDD t 
U U U U 00 0000 000 U D 0 0 UD D 0 0 UD D U U UD D 0 0 በ 
OU הק‎ ] በ D D D 0 0 D D DD 0 D D D D 0 D D DL 
U D D D D semoni 0 D 0 DD D 0 0 D D D DD DD DDD "DDD DDD D U 
0000 100 000 
00000 Um [OD 00 DDD 0 D DOD 0 DDD DDD DDD 0 0 D 0 
םםםםםםם‎ ጠበበሀበበበበበበበ ጠሸበበበሀበበሀበበበ[በበበ[ሀ[በ[በ 
000000000000000 ወጋጩበበበበበበበበበበበበበበበበ[በበ[[በ 
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O0O0O000000000000000000000000000000000000 
D0O00000000006nsQ000000000000000000000000 
U U D DH ne 0 000000000 semquee [0)000000000 semaueve [| [| 
00000 sempendi ng[] sempending lat JJ D D DD D D D D 
00000 9 ה‎ DD D D D D 0 00 D D D D D 0 0 
Sem. 10 D D D D D 0 0 0 D D 0 D D D D 0 0 D 00 D D D D 0 0 
U U 0 U D 0 0 00000000 0000 00 0 U D U 0 U 0 U 
U U U U DU [ 
በገ U U U D 00 00 በበበ በበ U DU DU 000 U 
[] 


sew 0000000000‏ םםםםםםםםםם 
eml ዐር 10 -1, IPC NOMIT L‏ 
OOO000000000000000000000000000000000000‏ 
OOU-100000000  8ፎ6መጩ[በ[በ[በ[[0[ IPC NAT D 0 D D B. B 0 D 0 D D D‏ 
D በ በ senbuf በ O O | seno)‏ 0 0 םםם 0 00 0 0 0 U D DDD DD D D DD 0 0 D‏ 


U U U U 000 U 
iff O senop sid, &semlock 1] = - UI 
fprintf[] stderr, "senop n"[] ; 


በ 30000 rsopsO0 D D 0 0 0 D D D D D 0 DD D 0 senbuf 
በ110መ91000000[ [0 18::ቨ [ቨ 


םםםםםםםםםהםהםםםהםםםהםםהםהםםםהםםםהםםםםם 
struct senbuf semunlock = í 0 1, IPC NOMIT ነ‏ 


0000000000000000 100000000 םםםםםםםםםםםםם 
U U U 0 U U‏ 


ብ][ D በ : senctl() 


U int senctl [] int semd, int semm int cnd, union senm arg [] ;‏ ה 

[1-םםםםםםםםםםם 0000 

OOO senct1 OC] 00000000000 

sert! O] 1 D D semd] 000000000 20000 sem [0000 
U D DD 0 0 D DD 00 DD DD D D D D 0 0 D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 
0] 




































































ו 
][ 
][ 
U LU U‏ 
U U U‏ 
U U U U‏ 
U U U U‏ 
seml ock‏ 
























































a G ₪ G‏ |! בם 



































e መወ [1111000000000000000000 72000 
e הצא‎ D D D I semmQ 00000000 include/linux/semhQ 0000 Ú 


utt 
/* arg for 560611 systemcalls. */ 
uni on senun 1 


int val; /* value for SEIVAL */ 
struct semd ds *buf; /* buffer for IPC STAT &IPC SET */ 
ushort *array; /* array for ŒTALL ₪ SETALL */ 


struct semnfo * buf; /* buffer for IPC INFO */ 
void * pad 
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bu D ₪0‏ 7100000000000 30000000 םםםםםםםם 
םםםםםםםההאת DOO000000000000000000000000000‏ 
























































በ UNO 
በ 2 emit tu 
U U 00 
IFC SIAT 000000000 semd הא‎ 00000 sem 0000000 buf ] U D D 
IFC SET 0000000000 sed 60 00 ipe pri] 00000 semm[] הצ‎ D 0 Ú 
IR HAD |00000000000 
GTALL eg E BRO AE 
GINN O000000000000 
GHIH D U D 0 D 0 0 000 000 semen 0 AD 
CETVAL 000000000000000 
GAN 000000 100% 00000000 
SETALL. 0 ŒAL0 1 1 D] 
SEIVAL 00000 val QO00000000000000000 




















በገ U D U D 0 0 0 D 000000 U 
U D D DD 0 0 0 DDD DD DD semm] )J 00000000 GMAOOOOOGO 


U ፲ D [| seam [| 0 10 
int get semval[] int sid, int senmum[] 


d 


return] senct10 sid, semm ŒMA, 0][]: 


} 

3000000000000000000000000000000d‏ םםםםםם 
O0O0000000000000000000000000000000000000‏ 
U U U U 0 U D 00 0000 U‏ 











50 0 U 

U U U U DU U 
U i U 
U U 0 0 UD 0 0 U 
U U U UU U D 0 U 
U U U U U 

[000 











በበበበበበ በበ OO00000000000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםם"הגאםם‎ 
UD D D D D 0 D 0 UU ms D D D D 0 0 0 0 D D D nb t send [| 
በበበበበበበበበበበ"በበ 000 0000000 0000 0 U 








U D D D D 0 DDD semundof D D I D HH 0 include/linux/semhQ 000 D] 
00000000000 መጩበበበበ0800[0000000 dof 0 */ 


struct semundo { 
struct semundo * proc nex; /*7 000000000 semundo]O */ 
struct semundo * id ext: /* 0000000000000 semunqoDD */ 


int 
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send; 


ሥበበበበበበበበ” 





00 Hi | 
short * semd; /* በበበበበበበበበበበበበበበሣ 






































E 
semundo[] D D ם‎ 00 task strut D D D D D D 

U DDD በበ [በ በበበገበ በበበ በበበበ በበ D Ume 00 DDD 00 D 0 U 
U D DDD DD DD 000 semudof 0 00 0 0 0 D D 0 0 0 D 0 D D 00 0 D D D D D 
000000 semundo[(] (] H (1 0 0 0 0 0 በ task struct 0 000000000000 
በበበ semd&[00000000000000000000000000000000 
םםםםםםםםםםםםיםםיםםםםםםםהם‎ 2000-2000 DDD DD" 00" 
U U 





U D D D D 0 D 0 Hm D D D D semundo 0 0 0 D 0 D D D D 0 D 0 0 D D D D U 
U D D D D 0 00 DD D השאפ‎ D 0 0 0 D D D D D D task struct D D D DD D Ú 
U U U DU U D 0 0 0 D U 











7.3.2 U U DU 


O0O00000000000000000000000000000000000 
OO0O00000000000000/000000000000000000000000 
O0O0000000000000000000000000000000000000 
OOO0000000000 Mx 0 0000 DD D LOD DD DD 00000 DD 0 U 
U U U U U U D 0 0 0 D U 00 U 
nx J0000000000000000000000000000000000 
LIC D D 0 0 0 0 DD DD me 0 0 D D D D 0 D 0 D D D D D D nsgge 000000 
U D D 00 DDD DD ₪86 םםםםםםםםםםםםםםההה‎ 


100000 


010000000 השש‎ 
םםםםםםםםםםםםםםםםם‎ መመ፤ደ בםםםםםםםםםםםםםםההה‎ 
U 0 D D D D 0 DD DD D D D indudelinw/nsg PI D] D] D DU D U 0 
/* nsgsnd ] א‎ QO 0000000000% 
struct nsgbuf + 
long ntype; /* 00000000000 * 
char ntext[1]; םםםם*!‎ v 



















































































L 
U U U U D 0 U በ; በ በ በ mest D D NDN D 0 D 0 D 0 U D 0 0 0 [ [| በ net) 
U U U U D 0 U DD 0 U D [በ U D U 0 U D 0 U D U D U D U D UD U D 0 D 0 D 0 D 0 0 (U 
םםםםםםםהםםהםםםםםםם‎ 
struct ny nsgbuf + 
long mype; /* 0000 
long | id; /* 0000 
struct client info; [#0000 
L 
U U U 0 D 0 0 0 00 U D 0 U DD 0 U UD 0 U D U 0 U D 0 U D U D U D 0 D UD 0 U 
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U U 0 U D 0000000000 U 
U U 0 U D 000 U 





O0O0000000000000000000000 


Um 0000 0 000 000 U‏ םםםםםםםםםםםםםםםם 


incl 906/11 nux/ nsg. hD 00000 
#lefine MMX 8192 


/* max size of nessage [ bytes[] */ 


nypeen Hn DD 40000‏ 819200000 בםםםםםםםםם 


D 21D DD D D mg 


U D DDD DDD DD DD nsg000000000000 include/ 1ጩዉፀእ[ 


U D D 0 U 
struct ፲80 1 
struct nsg *nsg next; 
long nsg type; 
char *nsg spot; 
short nsg ts; 


L 
U U U msg nest D D 11111 0 UD U 0 U D U D U UD 0 0 D 0 D 0 D 0 D 0 U U 


D 31D DD D D 0 D nsgid dsi 


U U U U D U D 0 0 0 0 000000 DDD U D U 0 0 D U 0 0000 00 NO 
/* 0000000000000000 ₪860 * 


struct nsqid ds + 
struct ipc permnsg perm 
struct nsg *nsg first; 
struct nsg *nsg last; 
tine L nsg stine; 
tine L nsg rtine; 
tine t nsg ctine; 
ushort nsg cbytes; 
ushort ፲80 qnum 
ushort nsg abytes; 
ushort nsg | spi d; 
ushort nsg lrpid; 

bi 


200000: nsgget() 


መጩ()በ[ 0 0 D‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםהם 

00: int nsgget [| key t key, int nsgflg [| ; 

D0:00000000000000000000- 人 如 

senget DO D D D D D 0 DD D D D 0 0 DDD DDD 0 DDD D D D 0 DD D D D 
U DD DDD DDD DD DD D 0 0 D 0000 0 0 D 000 0 0 D D D matla DD በ 


U U 
e ICRA D D D D 0 0 U 


U U U U D U D U 0 U D 0 U 


e ICO 000 IPC RAM D 0 D D D D D 0 0 0 D 0 DD DD 0000 U 
Du הז‎ D በ D D senget ON 0 0 D D D D 0 0 0 D 0 D D D D 0 0 0 0 0 0 
OOO0000000000000000 IC הסיא הצא‎ D D D DU 0 0 D D nu 
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በ101[0[0[00000000[ በቪ; -1]1፪:፻56:ቨ D D D 0 D 0 DD IP GTOQOOO 
U U 0 U D 0000000000000 U 

80 םםםםםםםםםםםםםםםםההא םםםםםםםםםםםהםםםםם 
OOO0000000000000000‏ 


U D D D 0 0 D 0 D 000 D 00 0 D D 00 0 U 
int open queue] key t keyval [| 
{ 






































int qi d; 
iff [] dd = nsgget[] keyval, IPC GREAT | 0660 [] [| = - UI 
1 


return] - 10 ; 
} 


return] di d] ; 


} 
000000000000 0600Q0000000000000000000000 
OOO-100000000000000000000 


30000 0 [] nsgsnd() 


በገ] 0 0 D 0 D 0 D 0 D D D D D D D በበበበበበበበበበበገበበበበበበ[ 
0000000 ה‎ በ በ D U 

nsgsnd [| int mod struct nsgbuf *nsgp, int nsgsz, int nsgflg [ :‏ .11 ][ ][ ם 
000-10 ₪ש 000000 

nsgsnd) 10 100000000000 maet (D D 0 D 0 D 2000 መጩ[ 00 
U U DD D 0 0 0 0 D 0 D 0 D D D D D D D በመመ።በበበበበበበገበገበበበበ[:1[0[[ [በ 
0000000000 40000 

nsgf1g9 ] 000000 ጠበ DDD DD DD D 0 בםםםםםםםםםםהדששאאאז‎ 
O000000000000000000000000000000 IPCNOMTI [ DD 
U D D D 0 0 D DD 00 DD DD D D 0 U 


U D D D 0 0 D በበበ በ D D 0 D 0 U 
int send nessage] int qid, struct nynsgbuf *qbuf |] 
{ 














int result, length; 

/* nynsgbuf D D D D D DD ” 

length = sizeof] struct [| - sizeof] long] ; 
iff D result =nsgsnd] gid qbuf, length 0 | =-ዝ] 
{ 


return] - 11] ; 
} 


return] result] ; 


T 
בםםםםםםםםםם‎ dout D D D D 0 0 DDD D D og DDD 0 0 


— 285 - 



































UI Linux [ ul 


በበበበበበበበበበበበቨበበ[በበበ[በ ips םםםםםםםםםםםםםם‎ 
OOO000000000 መወመ()[ 0000 


ብ] D D D D D nsgrcv() 




















O U [] 1፡1. nsgrcv [| int mod struct nsgbuf *nsgp, int nsgsz, long ntype, int 
nsgflg [] ; 
+-םםםםםםםםםםםםםםםםםםםםםםםםם‎ 

00000 100000000000000000 ssgetOO 000000 2000 
በዉመጩበበ በበበ በበበበበበበበበበበ 30000 msgs 00000000000 
OOOO00000040000 

0 40000mype]00000000000000000000000000000 
OOO00000000000000000000 $J000000000000000 
D 0 D D DD DDD tye 1000 O00000000000000000000 

D 0 DD 0 D D መወ109000 אא‎ D 0 0 D 0 0000000000000 
በ ENMGI םםםםםםםםםםםםםםםםםםםםםםםםםהםהה‎ nsgrcv()[] በ 
םםםםםםםםםםםםםםםםםםםםםםםםם‎ EON DD DD 00 DDD D D 
[אאא םםםםהםםםםםםםםםםםםםםםםםם‎ 


םםםםםםםםםםםטםםהםםםםםםםםטםםםםם 
int read nessage] int gid, long type, struct nynsgbuf *qbuf [|‏ 
{ 


























int result, length; 


/* 00 nynsgbuf DD 00 000 */ 
length = si zeof[] struct nynsgbuf[] - sizeof[] long] ; 


iff result =nsgrev] did, qbuf, length type QO =-10 
{ 

return] - 10 ; 
} 


return] result] ; 


O0O000000000000000000000000 


7.3.3 OOOO 


OOO000000000000000000000000000000000000 
OO ወመ በበበበበበበበበበበበበበበበበበበበበበበበበበበ[በበበ[በበ[[በ 
O0O0000000000000000000000000000000000000 
OO0000000000000000000000000000000 LCD 000 U 
םבםםםםםםםםםם‎ SystemV LIC D D D D D Eng DDD DD 0 0 0 00 DD 0 U 
በገ በ 0 U D 00 0000 U 
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100000 


በገ] በ በ U D 0 0 0 D 0 0 0 0 0 0 0 U D U 0 U D U 0 0 0 0000 00 0 00 U 


U D D 0 םם‎ 00 DD shmd ds] D D D OG include/linux/shmhQ D D D D] U 


[#0000 000000000000 shmddsgQgogd. ” 
struct shmd ds + 














struct ipc permshmperm /*Oo000 v 
int shmsegsz; /* 000000000000 ሣ 
tinet shmati ne; !* 00000000000000 * 
tine t shmdti ne; /* 0000000000000 a 
tinet shmcti ne, /* 0000000000000 a 
unsigned short shmcpi d; /*0000000 pa 
unsigned short shml pi d; /*> 00000000000000 od 
short shmnattch; 0000000000000 * 
/* 000000 v 
unsigned short shmnpages; הםםםםהםםהםםםם‎ * 
unsigned long *shmpages; [#00 frams ->SHWAXQO OOOO * 
struct vmarea struct *attaches;  /* 0000000 * 
bi 
U DDD 74000000000000 smd םםםםםםםםםהההה‎ 









shm_perm 
shm_segsz 





shm_npages 
shm_pages 


attaches 





074 000 


מםםםםםםםםהת 


vmarea struc 


U U U 0 U U 














OO00000000000000000000000000000001000000 


00000 1000000000000000000000 Em 0000000 
1 LU U UU 0 0 000000 000 U DU 0 U D U D 0 0 U D 0 0 00 U 
U D D 0 0000 DD shmd ds D DD D D DD 000 DD DD 000000 D 0 DU 
በገ ገበ በበ 0 U D U D 0 0 0 D 0 0 0 000000 U U 0 0 U D U 


U U U U D 0 0 UU D 0 0 0 0 U 


























vm_area_struct 
vm_next_shared 








vm_area_struct 










םםםםםם 


[| 
[| 
[| 
shnid ds 0 0 


U U U U D 0 0000000000000 U 
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U U 0 U D ND NONONO ND U D U 0 0 0 U 00 0 00 0 0 0 0 D U 0 U D U 
U U 0 00 U 

















U U 0 U D ND DOON U DU U D U 0 0 0 U 00 0 00 0 0 0 0 D 0 0 U D U 
U U U 

















































































































3070000 [| shnget() 


U int shnget [| key t key, int size, int shnflg |] []‏ ם 
ע<-םםםם.םםםםםםםםםםםםםםםםםם 
בםםםםםםםםםםםםםםםםםםםםםםםםהםםהההם 00 shnget‏ 


4] D 00 OC shnat() 


OOO int smat[ int shmd char *shnaddr, int shnilg] [| 
ע-םםםםםםםםםםםםםםםםםםםםםםםםםהם‎ 
በ በ ₪87 בםםםםםםםההשםםםםםםםםםהםהםהה ה 0 ב‎ 
000 0 shaiilag] םםםםםםםההצאצאאא םםםםםםםםםםםםםהםהםהה‎ 
U 0 0 0 D 0 1 በ በበ shadda] O0000000000000000000000 

U D D D 0 0 D 0 D 0 D 0 D DD D D D 0 D 0 D 0 D D D D 0 D 0 D 00 0 0 D 0 U 


U U U UD 0 D 0 0 DD D U 0 UD 0 U U 
char *attach segnent[] int shmd [] 
{ 














return] shnat[] shmd, 0, OD: 


በገ] U D U D 0 0 0 D 0 0 0 0 00 0 U DU 0 U DU D U 0 U D 0 0 0 0000 U 
U U U U 0 U D 00 0000 U 


x10 D D D D] shncti() 


O00 int shmtl [| int shngid, int cnd, struct shmd ds *buf [] ; 

נע-םםםםם0 0000000 

בםםםםםםםםםםםםםםםםםםםםםםההה ה sent!‏ בםםםםםםם 
utt‏ 

e IFC SIX D D D D D D shmd ds D D D D D D but DD D D 0 DU 

e IR SPIP D D D D D 00000 but D 0 U D 0 0 [በ shmd GJ [1] ipc perni 
U D U 

s IPC HP D D D D U D D D D D 

e IFC HDD 0000000000000 00000000 DD 000 DD DD 
U D DD 0 0 D DD 00 DD DD D D D Lt 

U DDD DDD DDD DDD D D D D D DD smt OI 0000000000000 
U D DDD DD DDD DDD D 0 0 D D በበ shmddsQ በ በ shmnattch D በ በ 100 
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םםםםםםםםםםםםםםםםבס 0000 
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U U U U U 0 U 0 LU 


U U D 0 0 00 D 0000 Ex 00 0 0 0 0 0000 DUDUDU" 00" Dag 
በገ UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
ם"םםםםיםםםםםםםםםםםםםםםםםםםםה האבתע בםםםםםםם‎ 
በበበ םםםםםםםםםםםםםםםםםםםםםםםםטםםםםםהםהההאתם‎ 
Wndow [ [00000 Hm D האתעםהה‎ DDD DDD D 0 0 DD D D D 0 0 0 0 U 
U U U UD U U D 0 0 0 D 0 0 0 0 U 000000000 000 U 

































































81 OO 


U D DDD DDD DD DDD ሀ ሀ በ 0 Mrual FilesystemSwtch D 00 VES] D D D 
U U 0 U DD DD ON ND U DU U D U 0 0 0 U 00 0 00 0 0 0 0 D 0 0 U D U 
םםםםםםםםםםםםםםםםםםםםםםהנפצט בםםםםםםםםםםםםם‎ 
000000000000000 662] Mnix MOS] VAM D D D D D 0 0 0 0 0 ED 
0 בםםםםםםםםםםההםנהפט‎ TRD 00 0000 Biz] Mni xi MDSD D D D D 
U uuu 


םםםםםםםםםת 


OO בםםםםםםםםםםםםםםםהםהפט םםםםםםםםהםה האתט‎ 
OO0000000000000000000000000VS00000000 
םםםםםםםםםםםםםםםםםנפטםםםםםםםם‎ lime 0000 D 
00081000 
VS D D D D D 0 0 0 D DD D 0 file opratoinQ 00000000000 
[] 
0 
0 








VSD 


000 En 000 D 0000000000000000 D 0000 U 
U U U UD U U D 0 0 0 በበ በሀበ በበበ በበ በሀ D UU 000 0 U 
U U U UD U U D 0 0 0 0 U 00000000 U D U 0 U D U D 000 0 U 
U uuu 
םםםםםםםםםהפטםםםםם‎ 
D01000000000000000000000000000000000 
0200000000000000 vite] open] stat] link[] [J 

OS D U 0000 DU00000000 U 
O400000000000000000000000000d 
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םםםםםםם 
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0 81 בםםםםםםםםםהההאתם‎ 
OO VES] ה*תג‎ 0000 D 0 0 00 00 DD 0 810 ኾ9ጩበበበበ[በበ[በ[[ 






























































U U U 

U 1 האתם‎ 0 0 U U 0 በ 0 U 

U U U U U U 
Mnix Eng] 0 0 0 0 D D D D 0 0 DD 000 D 60 D 0 D D 0 DÚ 

በ 400000000000 

Ext 0 10 Enx U 0 0 0 00 0 000 2B000004500000000000000 
Xiafs U Mix U U 0 U 0 0 0 0 0 U MmxQ@Q000000000000000000 
Fxt 2 000000 Hn) 0 0 0 00 UU UU 00000000 U 
Ext3 0000000 ®#t3000000000 20000000 
System V WX U 0 U 0 0 0 U 00 U U U እዘዚ፤11[1[ D 
NS U U U U U U UU 0 U U U U U U U 0 U 0 U U U U U 00 00 U U U U 
ISO 9660 םםםםםםםםם‎ 
/ proc U U U U U U 0000 U U UU UU UU U U U U UU 00 0 U 
Mdos םםםםםםםםםםםםםםההפם‎ Wx 
USD 0000000 םםםםםםםרפפא‎ ፀበጩበበበበበበበበበበበ 
Mat fat 000000000000000 
Nfs Wndows NO OOOO 
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@/200000 






























































20 ኣላፍ 0 D D 00 0 U 


0 8200 VSON NON NN 0000000000000 00 0 DD 00 DDD D D 
U DD DDD DUD TS 00 D 0 DD 00 0 0. 0 iopernt 70 1ዐር11( ) pipa ה(‎ 
nknod( 10 D D D D D DDD D 0 0 DD D 0 DDD DD DD 0 D 00 םםםםםםהפצ‎ 
U D D D D DD socket( )[] connect( ה(‎ bind )Q protocols 10 DD 0 በ D ü ü 
U 0 000000000 U 

























































































D 2 םםםםםםהפט‎ 
U U 00 U U U 

noun( )/ umunt( ) O0/000000 
sysfs( ) 00000000 
statfs( )/ fstatfs( ) /ustat( ) OO000000000 
chroot( ) U U 0 0 U 
chdir( ) /fchdir( ) /getcvd( ) U U 0 00 0 
nkdir( ) /rndir( ) 00/0000 
getdents( ) /readdir( )/ link ) אתוש‎ ) 1 D 0 D 0 D 0 0 0 
/renane( ) 
readlink( ) /symink( ) U U D DUDU U 
chow( ( /fchow( ) /lchow( ) O000000 
chnod( )/ fchnod( ) /utine( ) 000000 
stat( ) /fstat( ) /Istat( ) access( ) O00000 
ope ) /close( ) /creat( ) /unask( )) 00/0000 
dup ) /dup2( ) /fcntl( ) O000000000 
select( ) /poll( ) UD 1/000 
truncate( ) /ftruncate( ) םםםםםם‎ 
1569 ) / llseek( ) 000000 
read )/ wite( ) /read( ) /wite( הה|(‎ 1/7000 
sendfile( ) 
pread( )/ pwite( ) 0000000 
nmap( ) /mmnap( ) U U D 0 0 U 
fdatasync( ) /fsync( ) /sync( )/ nsymc( ) םםםםםםםם‎ 
flock( ( U U D 0 U 

















םםםםםםםםםםםםםםםםםםםםםםםםםםהפצםםםםםםםםם 
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בםםםםםםםםםםם‎ VSO0000000000000000000000000 
םםםםםםםםםםהםבפצםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
ו םםםםםםםםםהם‎ 10 D 0 0 D 000 D 0 DDD 0 DD 0 DD 0 0 D 0 0 0 0 
בםםםםםםםםםםם‎ VS000000000000000000000000000 
םםםםםםיםםיםהפט בםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U 0 U D 0000000000 U 
































מםםםההפט 8.2 


U U U U D U D 000 U 
በገ በ በ 00000 U DU U 


[] በገ U U D U D 0 0 0 D 0 00 0 0 U D UD 0 U 
U 
U U U U D U D 0 000 U 
[] 
[] 


UN XD D D 1] D D D 0 0 0 U 

U U U U D U 0 0 0000000000 UD uu 
በበበ 0 00 bag 0 D 0 0 0 0 0 D 000 U 
O0O00000000000000000000 


[] 
[] 
[] 
U U U በ1 1101100000. [] 


[] 
[] 
[] 
U 
OO (#4 D 0 0 


U U 
U U 
U U 
U U 
U U 


EET 
O 0 
Om 
ES E 
ET E) 
ELE 
זר‎ ES 


በበበ በ] U 00000 000 U 
U D DD superblock] D O 0 D 0 0 0 DDD D D 0 D 0 D 0 D D D DD D D 0 DUU 
OOO0000000000000000000000000000000000 
בםםםםםםם‎ 
N00 DO imod] AN D 0 0 DDD D D D D 0 000 D DD D D D D 0 0 000 0 U 
O000000000000000000R8Q000000000000000 
DOO0000000000000000000000000000000000 
[] 
በ D 0 demt ረጠ מםםםםהפטםםםםםםםםםםםםםםםםםםםםה‎ 
אש םםםםםםםםםםםםםםםםםםםםםםםםםם‎ 000000 
በበ” 0000000000000000 םבםםםםהש‎ 200000000 /tn 
OOOO test 000000 30000000 
- DDD fil] 0 DDD DD 0000 DDD DD 0000 DDD D 00 D 0000 U 
በገ በ 0 U D 00 0000 U 
U U U U D U D 0 0 U D 0 0 00000000 0 0 D U D U D U D U 0 0 0 000 U 
e J000000000000000000 

e בםםםםםםםםםםםםםםיםים‎ 

በበበበበ םםםםםםםםםםםםםםםםםםםםםםםםבפט‎ 









































o 
o 
AA AA EME, TE 


























8.2.1 [111111 


በበ] [በ D U D 0 0 0 D 0 0 0 00 DD U D U 0 U D U 0 0 0 0000 00 00 0 U 
נםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ Max] BLZ 000000 
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መበ በበ በ 0 0 000 በበበበበበበ &t200000000000 2 
VS) I0000000000000000000000000000000000000 
VS) D D 0 D 0 D 00 DDD W000 WSo00000000000000000 vs 
ם‎ D D בפצם‎ D በ በ inculde/fs/fs.hO 00000000 super bok] [000000 
U uuu 
































struct super_bl ock 
{ 


kdev t s dev; *O0000000000000000 
00000 /devhdall] 0000000 0x301*/ 
unsi gned long s H ocksi ze; םםםםםםםםםםםםםםם‎ 
םםםםםם‎ v 


unsigned char s 10026 bits; /*7 0000000000000 
000000 10240000000 109 
unsi gned 1 ong 1 ong s naxbytes; /* 0000000 * 
unsi 0060 long s flags; *אםםםם*!‎ 
unsi gned long s nagic: [XD D D DDD DD DD DD DDD D 
በበበ በበበበበሣ 


struct list head 5 list; /ቺ] ከ ከ፲ ከ *םםםם‎ 
struct senaphore s lock םםםםםםםםם םםר'*!‎ 
U uuu 
struct rw senaphore s mount 
unsi 00601 char 8 dirt; םםך*!‎ 
struct dentry *s root; /*[] 000 
int s count; /*[] 
atomic t S acti ve; 
struct list head s dirty; /በበበበበበበ[በበበበበ ሣ 
struct list head s locked 1 nodes;/” D 0 D 0 D DD D D D 0 D D D 0 */ 
struct list head s files 
struct file systemtype *5 type; ID D D DD 0 0 
file systemtype [J 
struct super operations *s op; PONDO 
U D 0 000000 0 
struct dquot operations *dq_op; /* 








noo 

noo 

noo 
o 
o 
o 
+ 











口 口 口 口 口 口 口 
nooo «oo 


U 
U 
U U U U 
U U U U U U 
U U 0 0 0 U 
םםםםםם‎ 






































[] 
U 
U 


u; /ግ] በበ 0 

L 

OOO00000000000000000000000000000000000 
OOO00000000000000000000000000 super blocks NOO 
5 1151 [| | next | prev GOs list] ה ה ה‎ ሀ ሀ] | struct list had [| [| [| Ú 


U s םםםםםםםםטםםםםםםםםםםםםםםםםםםםםהםהםה השיש‎ 
OOO0000000000000000000000000000s1ist[000 
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Linux [ [] I 









































list head 0 0 next በ prev]‏ 82000 םםםםםםםםםםםםםםםםםהם 
U U D U 0 U DU D 0 0 U‏ 


super_block 


next 
prev 





082 00000 


O0O00009000000000000000000000 


uni on 1 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 
struct 


struct ncp sb info 


Mnix sbinfo Mnix sb; 
Ext2 sb info Ext2 sb; 
ext3 sb info ext3 sb; 
hpfs sb info hpfs sb 
ntfs sb info ntfs sb 
nsdos sb info  nsdos sb; 
isofs sb info  isofs sb, 
nfs sb info nfs sb 
sysv sb info sysv sb; 
affs sb info affs sb 
ufs sb info ufs sb; 
efs sb info efs sb; 
shnemsb info  shnemsb; 
ronfs Sb info  ronfs sb; 
snb sb info snbfs sb; 
hfs sb info hfs sb; 
adfs sb info adfs sb 
anx4 sb info anx4 sb, 
reiserfs sb info reiserfs sb, 
bfs sb info bfs sb; 
udf sb info udf sb; 
ncpfs sb, 
struct usbdev sb info  usbdevfs sb; 
struct jffs2 sbinfo  jffs2 sb 
cranfs sb; 


struct cranfs sb info 


voi d 
?ጩ 


*generic sbp; 


O0O00000090000000000000000000000000000 
O00000000000000000000000VSQO0000000000000 
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OO00000000000000000 VS000000000000000000 


0000000000000000000000000000000000000000 
"מםיםםםםםםםםםהאתעםםםםםםםםםםםםםםםםםםםםםםםם 















































super operati ons‏ בםםםםםםםםהנםםםםםםםםםםםםםםםםםםםם 
UU 00 0 0 00 0 0 D 0 0 U D U‏ 0 בש U U 0 U DU 0 U D 0 0 0 0 0 NONONO‏ 
U U‏ 

















8.2.2 VS D [] [] 


U U U U በ] U D 0 0 0 D 0 0 000000 DU 0 UD U D U 0 U D U 0 D 0 0 DU U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
O0O0000000000000000000000000000000000000 
OOO0000000000000000000000 הפ םםםםםםםםםםהבפצ‎ 
םםםםםםםםםםםהם‎ VSQOOOOOOO0000 םםהפצטםםםםםההשא‎ 
000000 inode] 1/1/82 ה ה‎ 0024x0000 

















struct inode 


struct list head i bash Q*000000000*%/ 
struct list head i list; /ጠበበ[0000000” 
struct list head i dentry;/*0000000000% 
struct list head i dirty buffers; 
struct list head i dirty data buffers; 
1051 gned long i 10 /ሣማበበበበ” 
kdev t i dev; /*00 000 */ 
10906 t 1 node; /ብበበበበበበ0በበ0 v 
nink t i nlink 000000000000 ” 
udt i ud *אםםםםםםםם\‎ 
gidt i_gid /ጠበበበበበበበበበ[በበሣ 
kdev t i_rdev; /ገበበበበበበ”ኘ 
off t i size; /ጠበበበበበበበበበበበበኝሣ 
unsigned long i bl ksi ze; /*U D D */ 
unsigned long i blocks; /ሣማበበበበበበ” 
tine 1 i atine; /ጠበበበበበ080ቨ0” 
tine t i nting; /ገበበበበበበበ[” 
tine L i ctine; *םםםםםםף>\‎ 
unsigned long i versi on; /*üum* 
struct senaphre i zone; /*(7 0 00000000%*/ 
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struct inode operations Xi op /*0000000*% 
struct super block ጣጫ sb; [XD D D DDD DD DD DDD * 

atomic t i_count; /ገበበበ ሀሀ በ በበ 0 DDD 0 D ₪ 
םםםםםםםםםבםםםם‎ ” 

struct file operations Xi ያጩ /*7O 0000000 */ 

unsi gned char i lock; /ኀሣገበበሀሀ በበበ በሀበ በበበ” 
struct senaphore i_sem /O0000000000000* 
wait queue head t *] wait; /ገገበበበሀሀ በበበ በበማ 

unsi 9060 char i_dirt; 1" D DDD DD DDD 00000000 

በበበሀበበበበ በበ” 

struct file lock *i flock; /ገበበበበበበበሀበበበ” 
struct dquot *i dqot[ MAAS; /9 OO 0 D 0 D 0 D */ 





























[EN] O O Ü Ü Ü Ü Ü 六 六 六 六 六 六 六 六 六 六 六 六 六 站 六 六 六 六 六 冰冰 站 站 冰冰 站 冰冰 冰冰 站 六 冰冰/ 


struct address space 


struct address space 


/ | Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Akk KAk AA AAA AAA AA RAIA 


*i napping, 0* OOOOO00000000*% 
i data; 


struct list head i devices; /*000000000% 
struct pipe inode info i pipe; *םםםםםם‎ 
struct block device ጣጫ bdev /ዝብ[በ[[[[0[0[00[0[” 


struct Char device 


*i_cdev; JSD D DD 0000000 * 


EPST] Ü Ü AAA 


















































unsi gned 1 ong i dnotify nask; /* Directory notify events */ 

struct dnotify struct “i dnotify; /* for directory notifications */ 

unsi gned 1 ong i state; /D00000000*/ 

unsi gned i nt i flags; /ገጠበበበበበበበበሣ 

unsi gned char i sock; AOOOOOOOOOOO 

atomic t i witecout; ה1*;‎ 0 0000 D */ 

unsi gned i nt i attr flags; /ግ] ] | [| U በ V 

uz i generation /QOOOOOOO*/ 

/ሻተተተተተተተ፡ተተ፡ቱቱተቱተቸቶቶዱዣ1] Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü Ü 7 

uni on] /ብገበበበበበገበበበበበበበበበበበበበበ[በ[[በ 
0 fsnane inode 1፲10[] [] [] [| */ 

› 

0000000000 השגה 

e םםםםםםםם‎ inod השגהה‎ 0 D D 0 0 ad i in] 00000000 
OOO0000000000000000000000000000000 inder[ 00 

e JO000000000 0000000000000000000000000 
O0O0O000000000000000000000nmædQ 00000000 udii gd 
םםםםםםםםםם‎ 

e 1800011111[1 D 11 dev D i ה‎ D D 0 D 0 D D 0 D 0 D 0 0 0 D 0 D 
U 0 0 0 D 00 0 0 i dew 0 0 0 D D 0 0 DD 000 0 0 00000 D 00 0 0 D 00 U 
םםםםםםםםםםםם‎ i rdv 
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U DD DDD 0000 UD 00 D D D D D DH inodh D D I D D D CD O inode 






































םםםםםםםםםםם 
。U0O00000000000000000000000U000000000000‏ 
i state] 0000 I መጠበ በበበ በበበ በትሽ DD 00 0 0 D 0 0 0 0 0 00 U‏ ם 
state 0 0 D D D r LOR D D D D D D 0 D 00 D D D 0 OI FN‏ וםםםםםםם 
D U D 0 0 0 EBON NUE‏ 0 0 םי 0 0 0 0 U DU UU D‏ 000 0000 מ ם ם U U 0 U‏ 
U U 0 U 0 U‏ 
םםםםםםםהה inode unused] next 0 0 prev‏ 01000000000000 
U U U‏ ררהההההםהםםםםםםם 
D D D D D 0 0 D 00 DD D U‏ ה6טגושטוםםםםםםםםםםםםםתתם 
s drtwD DDD 000 DD DD DD 0 0 0‏ םםםםםםםםםםםםםםםשם 
םםםםםםםהאגנו 3000000000000 0 































































































e 1.1.1. 1111101101. STE UU 00 0 00 B. D S.B B D HCH 
inode hashtable D D D D D D 0 00 DD D D D D 0 D 00 DD DD 0 0 000 DD 0 U 
U U U U U U D 0 0 0 በበበ 0 000000 000 0 DU 0 0 0 0 U D 0 0 U D U DU D በ 
הפפ םםםםםהםםםםם‎ DD 0 0 D D D D D D 0 0 0 0 D DD 0 0 000 DD 0 U 
U U U UD U U D 0 0 0 D U 0 0 0 UD 000000 0 በበበ 0 0 D U D U 0 0 D U 0 O 
U U 

inode operations 000000000‏ בםםםםםםםםםםםםםםםםםםם 
D 00 0 00 D 0 D D 0 0 0 D 0 D 0 0 0 0 0 U‏ 1.000 םםםםםם 

















8.23 00000 


ine 0 0 D D D D D D D D 0 D D dentry] directory‏ םםםםםםםםםםםםם 
D DD 0 D D 0 D D‏ הט enrtyJ D D D በ D dentry D D D D D d inode[| D D D D D D‏ 
OO inodeQ D D dent nD D 0 D D 0 D D DD D 0 D D 0 DD DD D DD DDD D D" D‏ 
በበበ” በበ በበበበበበበበበበበበበ D 0 dent D 0 DDD DDD 0 DD 0 D 0 0‏ 
בשו םםםםםםםםםםטםםםםםםםםםםםםםםםםםםםםםםםםם 
620 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםטםהה መ 2 inode‏ 
U U D U‏ 
dentry [| [| B. O incl ude/li nux/ dcache. h[] [|‏ 
struct dentry +‏ 
atomic_t d count;‏ 
unsigned int d flags;‏ 
struct inode * dinode  /‏ 
חםםםםם*! struct dentry * d parent;‏ 
םםםםםם*! struct list head d hash;‏ 
struct list head በ Iru; 1%‏ 
struct list head d child; ₪‏ 
struct list head በ subdirs; få‏ 
struct list head d alias; /*‏ 

















0000000 */ 
* 00000 */ 
* םםםםםםםםםםה* 
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dsubdirl 000000 dvfsnmt D D D demt D DD D DD D 0 0 0 0 0 0 D 0 D D U 


U U 
U U 
U U 


U U 
U U 








U U 


U U 
U U 
























































[] [ Linux זה‎ 
int d nounted; /* 0000000 a 
struct qstr d nang; /* 00000000000 * 
unsi gned long d tine; /* D drevalidateQOO0 */ 
struct dentry operations *d op /*QOOOOOO*/ 
struct super block * d sb; /ፆገገገበበ በበበበበበበበቨበሣ 
unsi gned long d vfs flags; 
void * d fsdata; /ፆገገገበበበ[በበ * 














unsigned char d i nane NWE ININ IFN; /* 0000 a 
L 
000 dentry[1 ] 000000000 
U D D D D שש‎ 0000000 in D D D D 0 0 D D D D DD 0 DDD 0 D 
O00000000000000000000000000 dentryOOOOOOOO 
በ dinodeQ D D D በበ inode) D D D 0 D D D D D D D D D D 1mwde 0 0 D 0 U 
O D detry)J00000000000000000000000000000000 
000000000] A0 00000000 1 node" D I 0 0 D በ0 i dentryl 
םםםםםםםםםםםםםםםםםם‎ dentryOOOO 88418 |] U lJ inode 
OO i_dentryOO 0 
םםםםםםםםםם‎ dentry hashtable [| [] ] list head D OOOOUU000 
םםםםםםםםםם‎ dentry DD 00 detr D D 0000 d hash D n D ü 0 D D 
uuu 
םםם םםםםםם‎ dentry ጩሟሀ[ [ D D D D D DD count D D 011 OD dentry 
OOOO dlruf 0 DD 000 0 
Dentry [1 ] ם‎ d alias[] d hash] diruf ה‎ HB DU [| [| በ vfsnmt[] d child 


EJ 





























U D D D D העש םםם‎ D D D D d chid D D D D 0 0 d subdirs JJ 0000 
000 parent 0000000 השא‎ D D D D D D D D D 0 0 dentry] n DU 
d sud ra D D D D D 0 0 [ 
U U U U D U D 0 0 0 D 0 0 D 0 0 D D U D 0 0 U D 0 0 0 0 0 0 0 000 0 U D U 
U U U U D U D 0 0 U D 0 0 00000000 0 0 D U 0 U U U D U በበ 000 U 
0 

















8.2.4 000000000 


U U U U D U D 0 0 0 D 0 0 0 0 00 0 U D U 0 U D U D 0 0 000 0 00 0 00 U 
በገ U D U 0 0000 0000 DU 0 U U U 


100000 


በ Ex 0000 DD DD ሀከ 00 file descri ptors] JO בםםםםםם ה‎ 
U D DDD 000 DD DD DD 0 0 0 bmx 00000000000000 NEN 
םםםםםםםםם‎ ፤5.ከቨ[ D D በ D 1024x 10249 20000000 256] l 

00000000 300000000000000000000000000000 
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םםםםםםםםםםטםש םםםםםםםםםםםםםםםםםםםםםםםםם 

סםםםםםםהששש נבםםםםםםםםםםםםםםםםםםםםםםםםםם 
DD DD DDD NOO fileQOOOO0000000000‏ האתעםםםם 
U D D D D 0 D 0 DD open file description] D D D D D 0 00 D D D D D 0 0 0 0‏ 
OO00000000000000000 VS000000000000000‏ 



































ET EET EN 
E 
L1 
L1 
El 







































































በገ] በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 0 U 
DUDU DD DD DD 0 Hiep I000000000000000000000000 
םםםםםםםםם‎ ኽ8191፲00በ008000000000000 filed 0000 
በገ በ 1010009000 

AQ shell script shell OO 0 0 0 0 D D shell‏ בםםםםםםםםםםםםם 
A00000000000‏ 000 100000000 םםםםםםםםםםםםםםםם 
U D DD 28000000000000 2800 0 sell D 0 D 0 00 DD DDD D D U‏ 
U DD D DD shell D filef 0 DU 0 0 00 D D D D 00 DD 2000000000 2‏ 
0 
U‏ 





























OOO 1000000000000000 sell 00000 DDD D 00000 200 
0000000 1000000000000000000000 
םבםםםםםםםםםם‎ filen DDD 0000 U 

file][IND00000000000000000000000000000000 
בםםםםטםםםםםםםםםםםםםםםםםםםהה6ה‎ MAO fs. hD D D D 
8192[] 



































file] 0 [] includalinux\fs.h0 00000 
struct file 
struct list head 111%: /*0000000000000% 
struct dentry *f dentry /ሚበበበበበ በበበ 
struct vfsnount *f vfsmt; /*0 0 *הההההףפט‎ 
struct file operations *f op; /በበበበበበበበበሣ 
node t T node; /D000000* 
loff_t f_pos; /0000000* 
unsi gned short f flags; /ጠበበበበበበበበበበሣ 
unsi 0060 short f count; /ጠበበበበበበበበ” 


unsigned long f reach, f ranax, f raend, f ral en, f ravin; 
/ጠበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበ[በበ 
*םםםםםם‎ 
int f ower; /*> 00000000 *םםםםנסע‎ 
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OLI Linux | [] | 


unsi gned int f ud f dd /*UDD UDD OI 














int f_error; *םםםםםםםםם\‎ 
unsi 0060 long f versi on; /*0 0 0 * 
void *private data; /*ttyOOO000 v 


E 

OOO0000000000000000000000 

e “00 U ሽን በ በበበበቨበበበበበበበበበበበበበበበበበ[ሀ[በበበበሸ[[በ[በ 
O0O0O00000000000000000000000000000000000000 
000000000000000 f cout 00 N000000000000 
free list 0000000000000000 NS RESERVED H LES [] 0000000 
በ 10] 
e "]በበበ”በበበበበበበበበበቨበበበበበበበበበበበበበበ[በበ[በ[[ 
OOOO f comt D 000 እዝ] D D D 0 D 0 0 D 0 D 0 D D D D በ በ ann list [] [] 
OO TSD D D D DDD DD DD D D 0 0 0 get eræty או‎ ODD D D 0 U 0 
በበ 000000000000000 NR RESERVED HIES] D D 0 D D D D 0 D D 0 0 
U U U U 000000 0 000 0 00 0 0 በበበ 0 0 00 [በ ሀ 


20000000 


U D DDD file strut DDD DD D D 0 0 0 DD DD files struct 
U DD 000 DDD DD 00 0 D D D D D D DO [ files strut OOO 
incl ude/ li nux/ sched. h[] [0000 


struct files struct + 
atonic t count; /* 00000000 * 











rwock t file lock; /*00000000.000 
tsk >alloc lock[] 1 OO ” 

int nax fds; /ጠበበበበበበበበበሣ 
int nax fdset; *בםבםםםםםםםםם/‎ 

int next fd; א םםםםםםםמםםניה‎ 
struct file * fd /* 0000000000000 v 
fd set “close on exec; /”] 000 exe] 000000000000 * 
fd set *open fds; *םםםםםםםםםםםם\‎ 

/ 0 


fd set close on exec init;/*QQ eet] 00000000000000 U 


HES 








fd set open fds init; /ጠበበበበበበበ[በበ” 
struct file * fd array[32];/* DOO *אםהההההההה‎ 
› 


fdg000000000000000000000 mx fd DDD DD 0 td.0 0 U 
files_structQ 0 0 fd array] 00000 220 D D D D D 0 0 D 0 0 0 0 0 0 D D D U 
OO 390000000000000000000000000000 םםםםםםא‎ 
OOOO max fds ON [ 

OOO fa) O00000000000000000000000000file 
descriptor 0 000000 10000000 GO OO0000000000000 20 
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U DD DDD םםםםםםםםםםםםםםםש‎ 30000000 0000000 

DU DD DD 0 8400000000 בע‎ d200 ₪0 םםםםםםםםהה‎ 
U U 0 U D 0000000000 U DU U D U 0 U D U 0 0 0 000 0 00 0 00 U 
000 shell 0000 2800000000000000000000000000 
U U U 
open fds | [ ה‎ open fds 1ጪ1[ 0 D D open fds int D 00000000000 
א6ואתםםםםםםםם‎ D D D 0 D 0 D 0 D D D D D 0 በበ fdsetQ 10240000 
U U 0 U D 00 0000000 U U DU U D U 0 0 0 U 00 0 00 0 0 0 0 D 0 0 U D U 
םםםםםםםםםםם‎ 

fetO000000000000000 fd‏ םםםםםםםםםםםםםםםםםהםם 
םםםםםםםםםםםםהםםהםםהםההה current-#iles- fd fd]‏ בםםםםםםם 
OOOO fdd 00000 NUOO 100000fgtO0000000000 f cout‏ 
10 000 
















































































083 0000000 


OOO0000000000‏ ₪0 םםםםםםםםםםםםםםםםםםםםםם 
f cut D D DD 0 0 D D D D 0 0 0 NON O‏ םםםםםםםםםםםםםםםםםםהם 
םםםםםםםםםםםםםםםםםנםםםםםטםםיםםיםםםםםםםםםם 
U DU 0 D i witeacces[[P0000000000000000000000" D‏ 
םםם"םםםיםםםםיםם 


ዌቭ 1101010100 [ 0 ₪977 


fs struct [00 240000000 include/linux/sched. [] OOOO 
struct 15 struct 1 

atomic t count; 

int unask; 

struct dentry * root, * pwd 





L 
| 24000000000 include/linux/fs struct. h[] : 
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struct fs struct + 
atonic t count; 
rwock t lock; 
int unask; 
struct dentry * root, * pwd, * altroot; 
struct vfsnount * rootnmt, * pwidnmt, * altrootnmt; 
L 
count [| D [1 በ በ ם‎ fs struct D D D በ በ በ በ האפ‎ በ vask] D D D D 0 0 U D 
U U U U 0 0 0000 0000 000 [በ በ 
fs struct [ | dent ry 0 በ] D B] HH D 0 DD D roof pw] altroot D [] Ú 
D 0 D 00 D DDD D root D ] D D dentry DD 0000 D DDD DDD D 0 DD 0 0 
םםםםםםםםםםםםםםםהם‎ መበበበበበበበበበበበበበበ atrot [000 
םםםםםםםםםםםםםםםם‎ 30000000000000000000000 
00000000070 በበበበ &200000000000000000008 
LU U | LGG (U ה‎ [| [] 1 [] ፻5 struct 0 | [] [| rootnmt[] pwdnmt[] altrootnmt [| O 
0300000000000000000000 vfsnount] 


ee 














o 





























825 0000000000 


U U U U D U D 0 0 0 D 0 0 0 0 0 0 0 U D U 0 U DU 0 0 0 0000 00 0 00 U 
U U U [በ በ U 1110009000 
በገ U D U D 0 0 U D 0 0 0 0 0 0 D 0 0 0 D U D 0 0 0 D U 0 0 0000 U 
U U U D U በ D 0 0 0 D U 0 0 0 U 00000 00 0 U 0 U 0 U D U 0 U 0 U D 0 U 
בםםםםםםםםםםםם‎ fs street DDD 00000 DD 0 D 00000 0 U 
files struct D DD D D 0 0 0 0 DD D D 0 D 000 fileQOO00000 840 
U U U DD U D 0 0 0 0 U 











0 
U 
[] 
[] 


=: ርን. GE 
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fs struct 


dentry 


På d inode 


LT dentry 


count 


[0] dentry 


TT EE 


fd[255] 2 file operation 












task struct 














根 目录 的 inode 



































当前 目录 的 inode 























0840000000000000000 





8.2.6 000000000 


aù 0000 U‏ בםםםםםםםםםםםםםםםםםםםםםםםםםםהפט 
U U 0 DU00000000 VSO0000000000000000000000000‏ 
U U 0 DU 0 D 0 0 0 0 D 0 H ne 0 0 00 0 0 0 D 0000 0 0 D 000 0 0 00 00 U‏ 
DO0000006nsQQ000000000000000000000000000‏ 
D D 0000 U‏ הא S000‏ בםםםםםםםםםםםםםםםםםםםםםםם 
םםםםםםםםםםםםהבפט 850 በበበበበበበበበበ በበ spog‏ 
םםםםהפצטםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
מםםםםםםםםםםםםםםםםםםם 
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VFS 


用 于 操作 的 数据 结构 











DEE, O EE E. 


HRA 具体 文件 系统 B 


085 vsS0000000000000 
נבםםםםםםםםםםםםםםםםםםםםםם‎ MS 0000000000 U 
1000000 


0000000 super operations OO 0000000000000 D D D 0 0 0 U 


በበ sop DD dul 17 
JX 
* NJE: wite inode, delete inode, clear inode, put inode can be called 
* wthout the big kernel lock held in all filesystens. 
*/ 
struct super operations { 
void [| fread inode] [] struct inode *[] ; 
void [| fread inode] [| struct inode *, void *[] ; 
void [] "dirty inode] [| struct inode *[] ; 
void [| *wite inode] [ struct inode *, int]; 
void [| *put inode] [| struct inode *[] ; 
void [] "delete inode] [| struct inode *[] ; 
void [| *put super] [] struct super block *] ; 
void [] *wite super] [| struct super block *[] ; 
void [| *wite super lockfs[] [| struct super block *[] ; 
void [| *unlockfs[] [] struct super block *] ; 
int [| *statfs[] [] struct super block *, struct statfs *]; 
int [| *renount fs[] [ struct super block *, int *, char “], 
void [] *clear inode] [| struct inode *[] ; 
void [| #unount begin] [| struct super block 4]: 








U 
םםםםםםםםםםםםםםםםםםהםם‎ 8300000 
0 3 U U U U UU UU 000 U 

U U U U U U 
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T inode D 00000000001%ቄ00 im0000000000 
EE 0000000 ine D D 0 0 0 0 0 0 DDD inoden 0 
Dirty inode(i node) l inode[] OO“ 0” 
"WT 000000 inde 00 D D ከከ D D inode inen] i 190000 
Kee 00000000000000 
0000000000000000000000000000000 
Put i node( i node) 0000000000000000000000000000000 
000000000000000 
Dal ete i node( i node) 0000000000000000 ህመ00000000 
Niti fy_change( dentry, 0000 iattr 000000000000000000000000 
iattr) VEST H [| [| wite inode( ) OO 
Put super(super) 0000000 
Wite super(super) 0000000000000000000 
Statfs(super, buf, 
te 0000000000000 20000 
Am issue fla Ippgg0000000000000000000000000000 
Pe anam 0 put 186% 0000000000000000000000000 
- በ00 
ent. begi n( super) 000000000000000000000 
OO0O000000000000000000000000000000000000 
OO0O000000000000000000000000000 





20000000 inode operations 


U D D D D 0 0 0 inode operations HO 00000000000 VSOOOOOO 


፤5.ከበቨ ቨ[ በ ቨ U‏ םםםםםםםםםםםםםםםםםםםםםם 


struct inode operations + 
int [] *create[] [] struct inode *, struct dentry +, 1፡11] ; 


struct dentry * 


[] *lookup] [] struct inode *, struct dentry 4]: 


int [] *link] [] struct dentry *, struct inode *,struct dentry *[]; 
int [] *unlink] [] struct inode +, struct dentry *[] ; 

int [] *synhink] [] struct inode *, struct dentry *, const char *J ; 
int [] *nkdir[] [| struct inode *, struct dentry *,int] ; 

int [] *rndir[] [| struct inode *, struct dentry *[]; 

int [] *nknod] [| struct inode *, struct dentry *, int, int] ; 

int [] *renane[] [] struct inode *, struct dentry +, 


struct inode *, struct dentry *[ ; 


int [] *read ink] [ struct dentry *, char *,int[] ; 

int [| *followlink] [| struct dentry *, struct nanei data *[] ; 
void [] *truncate[]] [| struct inode *[] ; 

int [] *pernission] [] struct inode *, int]; 
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int [] ”reval i date] [] struct dentry *[] ; 


int [] *setattr[] 
int [| *getattr[] 
L 
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[] struct dentry *, struct iattr *[] ; 
[] struct dentry 2 struct iattr *[] ; 



















































































84000000000000000000 ם 
U D D 000000000 0‏ 4 |[ 
OD‏ 0000 
Greate(dir, dentry, node) U D 0 0 0 000 0 dentryQOOOOO0000000000000‏ 
OOOO‏ 
Lookup(dir, dentry) U D 0000000000000000 0000000000 0‏ 
ዐ6ቪ፲ሃ[ OOO‏ 
םם*א 000000000000 Ti nk( ol d dentry, dr, |00000000 newdentryQ‏ 
new dent ry) OOO old dentry[] OD‏ 
םםםםםםםםםה השאא unlink(dir, dentry) U drU O00‏ 
synhink(dir, dentry, synmane) | 0 0 0 0 0 0 0 0 0 0 D 00 0 DDD 0 DDD DD DDD 0 D‏ 
nkdir(dir, dentry, node) በገ [በበበገበበበገበገበበበበገበበበበበ[በ[በ[[‏ 
nknod(dir, deny node, | dr DUD DD DD DD D D D 0 0 0 0000 00000000‏ 
rdev) U D 0 [ ሀ በ በ በ node] rdev0000000000000000‏ 
U 000‏ הה mew dr D‏ ה renane(old dir, old dentry, O ad dr U [ [ [] [| old dentry[]‏ 
new dir, new dentry) OOO newdentry] 000000‏ 
readl i nk( dentry, buffer, | O dentry D 000000000000000 000 bfer 000‏ 
bufl en) OOOO‏ 
followlink(inode, dir) OO inode0000000000000000000000000‏ 
U D 0 0 ዉ፲00[00000:0‏ 
truncat e(i node) U D 0 D 00 imd [0000000000000000000‏ 
םםםםםםםםהה inode] OO i size]‏ 
node, nask) U D 0 0 0 00 inode000000000000000000‏ 1 )תס pernissi‏ 
reval i dat et dent ry) D000000000000000000000000000000‏ 
Setattr[] dentry[] attr] 00000000‏ 
Gtattr[] dentry[] attr] 00000000‏ 
OO0O000000000000000000000000000000000000‏ 





U D D D D 0 000 0 OnsdosQ D D D D 0 D 0 D D D D D fs/nsdos/nani .c[] O O 


U U U 


struct inode operations nsdos dir inode operations = + 


creat e: 
1 ookup: 
unl i nk: 
nkdi r: 
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nsdos create, 
nsdos lookup, 
nsdos_unl ink, 
nsdos nkdir, 











[] | [] | [] | 
rndir: nsdos rndir, 



































renane: nsdos renane, 
setattr: fat notify change, 
bi 
3] DD L L 0 


U ם‎ በ 0 0 ם‎ D dentry operations [ 0 0 000000000 
incl ude/ li nux/ dcache. hp [| 
struct dentry operations + 
int [| *d revali data] [] struct dentry *, int] ; 
int  *d hash] 0 struct dentry *, struct gstr zl: 
int [| *d conpare[] [] struct dentry *, struct gstr *, struct qstr *[] ; 
int [| *d delete] [] struct dentry 4]: 
void [| *d rel ease] [] struct dentry 4]: 
void [| *d iput[] 0 struct dentry *, struct inode *[ ; 
L 
0 85000000000000000 




































































0 5 000000000000 
0000 UD 
| 0000000000000000vS000000000 
d revali dat e( dent ry) 00000000 
0000000000000000000000000000000000 
d hash(dentry, hash) | םה‎ dente D 0 D D D 0 00 0 0 0 0 0 0 D eeh D OO HDH HDD 
00000000000000 becht D 0000 0 0 
dcomere(dir, marel, | 0 00 00000 መ1በ 000 @r00000000000VS0000 
-- 000000000000000000000000000000000 
ን 0000000%2800000000000000 
00000000000000000 d com 00" 00000000 
DRE COCOCOMSO000000000 
O000000000000 ጸ8ወ800ወ00008808808000 
RAR) VS0000000000 
| | 00000000000000000000000000000VS000 
diput(dentry, in) | ከ ከ08 השק‎ 
440000 
U U [1 [| D file operations] 111 ga B በ በ D fs. hn D 
/* 
813 * NOE 


814 * read 18116. poll, fsync, rech, witev can be called 
815 * wthout the big kernel lock held in all filesystens. 
*/ 
struct file operations { 
struct nodule *owner; 
loff t [] *llseek] 0 struct file“, loff t, int]; 
58126 t [| *read] [ struct file *, char *, size t, loff t ግ]; 
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58126 t [| *wite] [ struct file *, const char *, size t, loff t 4], 
int [] *readdir[] [] struct file *, void *, filldir tp; 
unsigned int [| *poll[] [D struct file, struct poll table struct *[]; 
int [| *1 0ር11[] [| struct inode *, struct file *, unsigned int, unsigned long] ; 
int [| *nmap] [| struct file *, struct vmarea struct *[] ; 
int [] *open] [] struct inode *, struct file *[[ ; 
int [] *flush] [] struct file 4]: 
int [|] "rel ease] [] struct inode *, struct file 4]: 
int D *fsynd] [| struct file *, struct dentry *, int datasynd]; 
int [| *fasynd] [| int, struct file“, int]; 
int  *lock] 0 struct file % int, struct file lock ሣግ] ; 
58126 t [| *readv[] 0 struct file *, const struct iovec *, unsigned long, loff t *]; 
ssize t [| *witev] [| struct file *, const struct iovec *, unsigned long, loff t *[]; 
ssize t [] *sendpage] [] struct file, struct page *, int, size t, loff t *, int]; 
unsi gned long [| *get unnapped area[] [] struct file *, unsigned long, unsigned long, 
unsigned long, unsigned long] ; 
E 
םםםםםםםםםם‎ መሽበበበበበበበበበበበበበበበበበበበበበበ[በ[በበ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 86000 






















































































D &6 0000000 
0000 T 
000000000000000000000 Msn nod 

SPESE 0000000 
11 seek(file, offset, 
Ge 000000 
au^ bub | OOOO offset OO D Ü D emt D D D D DO 00 *offset 0 0 
"Rege | POOO 0 wette D D 00 0 com D D D D D D D 0 “offset 0 D 
reddir(dir, diret, |00 6ሺ፡0000000000000000000 ቋ፡መበ00 
filldir) findr00000000000000000000000000 

| 0000900000000000000000000000000 
poll(file, poll table) 000000 
ag mede file mg lppoo000000000000000000000 
map(file, vna) 1000000000000000000000000 
openti node, file) 0000000900000000900000000000000 
uio 00000000009000000000000000080000 

000 f com 000000000000000000000 

eer 0000000000900000000000000000000 
a NE 000 ፤ com 00000 00000000 
Fsync(file, dat 0 81900000000900000000 
fasync(file, om 000000000000 1000 



































U U 
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U U U U 



































D U 

















| 00000000088800000000008888008000 
check media change(dev) | በ800000000000000---00000 ORM 

| 0000000000000000000000000000000 
Feral re) 0000000000000 





lock(file, cnd, file lock) 


file] 000000‏ ם 





readv(file, iovec, count, 
offset) 


0 read) D በ 1 በ በ በ በ D rem] 000000000000000 
U U U U U U በ. 





Witev(file, 
offset) 


buf, iovec, 





በ witeQOOOO000000witeOO 0000000000000 
U U U U U 





D 0 000 DD D D 0 0 0 00 D D D D 0 0 0‏ ה D D D 0 file operations‏ הפצ 
file operati ons 1‏ 24000 ה22םםםםםםםםםםםםםםםםםםםםםהם 
NOOO‏ 000000000 220000000000 םםםםםםםםםם 


struct file operations device fops = { 


NIL, 

devi ce read, 
device write, 
NIL, 

NIL, 

NIL, 

NIL, 

devi ce open, 
NIL, 


devi ce rel ease 


/* seek */ 


/* read */ 
/* wite */ 


/* readdir */ 
/* poll */ 
/* ioctl */ 
/* map */ 


/* open */ 


/* flush */ 


/* release */ 


bi 
0000 CONDO 24000000 eect t DD trn 0 
struct file operations device fops = 1 


read : device read, /* read */ 
wite : device write, /* write */ 
open : device open, /* open */ 


release : device release /* release */ 


L 
U U U DD በ በበ DD DU U 0 0 በበበ U D D D D U በ D D D D 0 0 D U 


8.3 [] [] [] [| 


8.31 [ODDO 
Dm J0000000000000000000000000000000000 


OOO000000000000000000 buffer cache] 0000000000000 
םםםםםםםהם‎ 1000000000000000 buffer heed NOO 200000 
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OOO00000000000000000000000000000000000000 




















OOO0000000000000000000000000000000860Q0000 
U uuu 


U uuu 


U U U U D U D 0 000 U 
e [000000000000000000000000000000000000 








e U UU UU UU DU 00 0 0 0 0 00 0 0 U 0 0 UU D U D 0 0 U D 0 ሀ ሀ 0 ሀ ሀ U 
e 0000000 


buffer_head 


U U D UU SKB 


111 


00000 

















086 00000 


buffer- head] [| [| OG include\linux\fs.hO 00000 
/* 
* Try to keep the nost commonly used fields in single cache lines [| 16 
* bytes[] to inprove perfornance. ‘This ordering should be 
* particularly beneficial on 32-bit processors. 
* 


* W use the first 16 bytes for the data which is used in searches 
* over the block hash lists [] ie. getblk[] [| and friends]. 
* 


* The second 16 bytes we use for lru buffer scans, as used by 
* sync buffers] |] and refill freelist[][]. -- sct 
*/ 
struct buffer head { 
/* Eirst cache line: */ 


struct buffer head *b next; *אםםםםםה*!‎ 

unsi gned long b bl ocknr; “OOOO ሣ 

unsi gned short b size; /* 000 v 

unsi gned short b list; TT 0000000000 * 

kdev t b dev; /* 00000000 B FRE -freq] */ 
atonic t b count; /* 000000 * 

kdev t b rdev; /* 0000000 > 

unsi gned long b state; /* 0000000 a 




















unsi gned long b flushti ne; /*000000000000* 
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| 
struct buffer head *b next free;/* [ [ 1 

struct buffer head *b prev free;/* DH [1 [] 

struct buffer head *b this page;/* H 000000 
struct buffer head *b reqnext; /*0000 * 





struct buffer head **b prev; /* 00000 
char * b data; /* 00000 
struct page *b page; /* 00 *ההםההההפ‎ 

void [| *b end 10[ [| struct buffer head “bh, int uptodate]; /* I/O[] 000 */ 
void *b private; /* D bendiogg */ 











oro 





unsi gned long ከ rsector; /ፆሥበበበበበበበበበበበ0” 
weit queue head t b wit: /* 0000000 v 





struct inode * b inode; 
struct list head ከ inode buffers; /* inode(] 00000000 */ 
bi 









































በገ] በበ በ0 fs. ከበ111[0100 00 
/* ከከ state bits */ 
enumbh state bits + 
BH t odat e, /ፆሥበበበበበበበበበበበበበ1ሣ 
HILirty, /* 000000000000 1* 
FH Lock, /* 0000000000 & 
BH Req, /* 000000000000 * 
BH Mpped, /* 00000000000000 1” 
BH New /* 0000000000000000 1” 
BH Async !* 00000000 end buffer io async /ሀሸ0በበበበ1” 
BH Wit IQ /* 0000000000000000 1” 
PH] aunder, /ፆሥበበበበበበ”በበ”በበበበበበበ1ሣ 
B1] BD /* 000 journal head] םח חח‎ 1 % 
PHPrivateStart,/* 0 D 0 0 0 0 0 0 0 000 1000000000000* 
U 
U U U 0 00 0 000 0 D 0 0 D D 0 U D 0 (U 
ገበበገ 00 0 00 0 UD D 0 0 0 0 0 UD D 0 0 0 0 0 U ገበ ገበ 0 U 0 U D 0 0 0 0 (U 



































U U U UD U U D 0 0 በበበ 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 
U D D 0 0000 םם‎ buffer head] D D D b cont DD DD D D D 0 0 D 00 D D 0 U 
000000 O00000000000 םםםםםםםםםםםש‎ 

U D DDD 000 DD D DD 8 Dm 0 50 0 0 ቨ በ D D 00 D D 512710240 200097 
4098] 81920 00 H ms 0 0 0 0 D D D D 0 0 0 00 DD DD 000 DD DD D D 0 0 0 
DON NDN NONONO 0 00 0 0 0 0 D 00 D 0 D D me [OG 
U U U U 0 U D 000 U 

000 1198001010 300000 include/li nux/ fs. hD 0000000 
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#defi ne BUF FAN 0 *םםםםםםםםםםם!‎ 

#defi ne BF LOCKED 1 *םםםםםםםםםםםםם!‎ 

#defi ne BUF O RIY 2 *םםםםםםםםםםםםםםםםםםםם\‎ 

םםםםםםםםםםםםםםםהםםםםופצט 

OO0O00000000000000000000000000 bash tabe 0000 
O0000000000000000000000000000000000000 
buffer head D [D00000000000000000000000000000000 
U U U DU U D 0 0 0 D U 
נבםםםםםםםםםםםםםםםםםםםםםםםם‎ መበበበበበበበበበ[;[ 
Oooo trolist 000000 300000000000 30000 RO DDD D UL 
U U U U 0 U D U 0 0000000 U 
O000000000000000000000000000000000 b count 
OO 000000000000000000000000000000000000 




















L1 


L1 























םםםםםםםםםםםםנסע בםםםםםםםםםםםםםםםםםםםםםם 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U‏ 
በበበ መጠብበበሸበበበበበበበበበበ በ O000000000000000000‏ 
U U D 0 D 0 D D 0 D D 0 D 0 [በ በ‏ 
b cout O 1000 b comt QO 00 D D 0 D D 0 0‏ םםםםםםםםםםםםם 
םםםםםםםםםםםםהםההההאת 
OO00000000000000000000000000000000000000‏ 
U D D U‏ 
free list [] (]‏ םםםםםםםטםםםםםםםםםםםםםםםםםהם e‏ 
unsed list J 000‏ םםםםםםםםםםםםם e‏ 
fs/buffer.cQ D D‏ 00000000 
Dn DUU ከመጢጠጩጨከገበበበ 0 D 0 ü D D D DD 0 D D 0 rush D 0 D 0 0 [‏ 
መጠጨጩከጠበ[በ[በ‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
Op 00000000000000000000000000"0”"O000000000‏ 
OOOO00000"0”O0000000000000000000000000000‏ 
በበበበበ” 0” O0000000000000000 6040 00 D 00 D 0 D D 0 0‏ 
D 0 D 00 UD D 0 DD 0 D DD D D D D D 0 UD D ጩይፀበበበበበበበ000000 D‏ 
update -d‏ # 
BE ORY LR‏ םםםםםםםםם"ם יםםנםם"םיםםםםםםםםםםםםם 
D በ በእመመ፲መከበ]በበበበበበበበበበበበበበበበበበበ[በበበበ[[በበ በበ 500‏ 
update 0000000‏ 000 
update JO D0 000000000000000‏ םםםםםםםםםםםםםםם 
U U D 0 D 0 D D D D D 000000 000000000000000 00000000‏ 
בםםםםםהפשש םםםםםםםםםםםםםםםםיםםיםםםםםםים"ם 
D 0 DDD DDD 0 DD D D 0 D buffer head‏ םםםםםםםםםט"ם שםשםםם 
D D በ D ጭጩፎፀበበበበበበበበበበበበ”በ”በበበበበበበበ”በበ”በበ[በ[በ‏ 
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O0O00000000000000000000 



































832 DO 000000 


VS[0O0O0O00000000000000000000000000000000 
OOO0000000000000 ine JOOOOO00000000000000000 
OO0000000000000000 הו‎ D D D D D D D 0 0 000 DD 0 U 
U U U U 0 U D U 


םםםםםםת 


םםםםםםםיםםיםםםםםםםםםםםםםםםםםםםםםםםם 

e “inue” ה הה‎ U U ה ה‎ i count >00 i dimk >0000000 inode 
U U U 

e "dirty 000 “ inuse DDD" 0 "tu 

e “ unused” םםםםםםםםםםםההה‎ i cont = 0] 

םםםםםםםםםם 

static LIST HAN] inode in use] ; 

static LIST HAD] inode unused] ; 

static struct list head *inode hashtable; 

static LIST HEAD] anon hash chain]; /* for inodes wth NIL i sb */ 

OOO00000000000000000 

s 00000 inode ה‎ [00000000000000000 2000 
D DD DDD 000 D 00 םםם‎ 0 D D 1ኹ.ርኩጃጻ sb አካ ብ.በበበበበበ8በ 
anon hash chain [| 00 [| D] [] O net/socket.c [| sock alloc()]], OOOO 
fs/inode.c[] get enpty 1 nodet ה‎ D 0 D D D 0 D 0 D D 0 D D 0 0 D D 0 D 0 D 0 0 0 
anon hash chain[] [| [] 

e 00000000000000 inode in œe 0 D D D 00 D 0 DD D D 0 0 
OO get_enpty inode)I D D 0 በ D O get newinode 00000000000000 
U U D D D 0 0 0 0 0 D D D D 0 D 0 D U 

e םםםםםם‎ በ 0 1 0 0 D inode unused[] next] በ0 םםםםםםהםההאא‎ 
U U D D 0 D 0 0 U 

e 00000000000000 s םםםםםםםםםםםםםםההשיש‎ 

e 0 inoe[] 0000000000 

static knemcache t * inode cachep 

0000 ቕቋመበበበበበበበበበበበበበበበበበ 

00000 i hash D D D D D D D ፤ list JO in use] umeed በ dirty (DU 
D D D D 0 DDD D DD D D 1806810%በ1[000000:[ D 

Ñ A simple spinlock to protect the list nani pul ati ons. 
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* NJE You also have to own the lock if you change 
* the i state of an inode while it is in use.. 
*/ 
static spinlock t inode I ock = SPIN LOK UN OCKED 
በበበ 11] በ በበበበበበ[በ[በ inodeeintQOQOOOO0000000000000 
init/nain ር] [| start kernel O(] D D D D 0 inode int] 0000000000000 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 0 D D D D U 
U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D D D 0 0 0 D D D D U 
D 0 DD 0 DDD D DDD D 0 [በበ inodes stat t000 fs/fs.hD 11 d D D 
struct 180065 stat t + 
int nr i nodes; 
int nr unused; 


int dunmyl 5]; 














bi 
extern struct inodes stat t inodes stat 
0000000 0 /proc/sys/fs/inode-nr [| /proc/ sys/f's/i node- 81816 [] [] [] [] Ü 


O0O000000000000000000 
2J0000000000000 


20000 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
םםםםםםהםםםהםםהםםםהםםםם 

fd = open] "file", O RONY]; 

close] fd] ; 

fs/openc QQ sys open 00000000000000‏ םם D D‏ הפס 


fs/open.c[] D filp ה פיקס‎ በ D D D D filp open ה‎ 0000 
struct file *filp open] const char * ፻1] 60808, int flags, int node] 


int nanei flags, error; 
struct nanei data nd; 


nanei flags = flags; 

if 0 O nanei 11805-1[ &O AT MIH] 
nanei fl agsH: 

if [] nanmi flags GO TRN]] 
nanmi flags |= 2; 


error = open nanei [] filenane, nanei flags, node, 681] ; 
if [] ! error[] 
return dentry open] nd dentry, nd. mt, flags[]; 


return ERR PIR] error[] ; 
› 
OO nanei data] QO fs. ከ1111 U Dl 
struct naneidata 1 

struct dentry *dentry; 

struct vfsnount *nmt; 

struct gstr last; 


5 












































unsi qned int flags; 
int last_type; 

L 

OOO000000000000000000 ההש הש‎ dentry D C) D] DU U 
D D D D D D D UD ጋጸጋጩበበበበበበበበበበበበበበበበመጠ[በበበበበ[በበበበበ 
םםםםםםםםםם‎ 

filp open] 000000000000 

open nanei (10 D D D D D D D D D D 0 dentry D D D D D D D በ0 D በ vfsnount‏ 10 ם 
D dentry- 4 inode D 0 D D 0 0 0 D 0 D B. DD D 0 D 0 D 0 D DU‏ בשש 0000 
U U U 0 D 0 0 D D 0 0 D U D D D D D D U 0 D D D 0 D 0 U‏ 

0 2] dentry ה(‎ 00000000000000 file 0000000 DD D 
OOOO task 6 D 0 0 D 0 00 0 DD D 0 0 D 0 00 D 000 DDD 0 D 0 D 0 D U 
ם‎ f op omen 000000000000 leù DD 0 0 L 

open nmei()][][]D path valla 10 D DD D 0 D D 0 0000000000000 
path val k0] D D D D D D D D inode operati ons- 4 ookup()D] 0 D 00000000 
በበ DDD DDD DDD DDD D iget(sh in9 D DDD DD 0 D 00 D 0 DD 0 0 
D D D D D D D 0 D D D D 1imwde DD DD 0 0 D D 0 D 0 DDD 000 DD D 
H DU D 0 D DDD 0 DD DD DD d add(dentry, inode) 0 0 dentry OO inode 
OOO00000000000000000000000000000006rryQ00 
OOO dinodeJ הפוה‎ D D D D D 0 D 0 D D D 0 D 0 D D DD DD DD DD 00 0 
OOO00000000000000000000000000000 Hin D 0 0 Ú 
D D D D DD D DD DDD הפצ‎ D D CD በ D በ inodeQ OQ dentry D 0 D D 0 U 
0 D D D D 0 UD 0 ዉጩ6በ00 i dent ry D OU D [ent rv D D D D D D D da alias 
OOOO 1%ዌጩበ0በ[0[0በ0[ 
DU DDD DDD DDD DDD DDD DD D 0 D D D 0 "on DD D D 0 DD DDD D 
D D DDD D 1መ0[00[000 igt D D D ige4sb ino NU, NIDO 0 D U 


0000000 
struct i node *i get 4] struct super bl ock “sb, unsi 0060] ongi no, find inode t find actor, 
voi d #opaque[] 
t 















































struct list head * head = inode hashtable + hash] sb, ino] ; 
struct inode * inode; 


spin lock] & node lock] ; 
inode = find inode] sb ino, head, find actor, opaque] ; 
if [] inode] + 

. iget[] i node] ; 

spin unlock[] & node lock] ; 

wai t_on_inode{] i node] ; 

return inode; 
T 
spin unlock[] & node lock] ; 


/* 
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* get_newinode[] | wll do the right thing, re-trying the search 
* in case it had to H 008 at any point. 
ይ get newinode[] sb, ino, head, find actor, opaque] : 
T 
U U D 0 D 0 0 0 0 D D D D [በ በ በ 
e ind ה‎ D 000000 inode hashtable] D D [| inode הא‎ DDD D 0 0 ü 
find ההש‎ D D D D D D 0 D D D D D ine 0 D D D D DD 0 D 0 0 D 0 DD 0 0 
בםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ super הא‎ 0 D D U l 
በበ ]በበበበበበበበበበበበበበበበ[በበበበበበ፤ הנש‎ 1000 i ב‎ 
በበበ םםםםםםםםםט"םיםםםםםםש‎ inde unusedlist] ] D 0 D D 
D 0 D 00 DD DD DDD DDD inode in use 7000000 180065 stat. nr unused 
[] 10 
e םםםםםםה שו םםםםםםםםםםםםםםםםםםםםםםםםהם‎ 
U U D U 
e I000000000000000000000 (node D DD 0 D 0 DD DUDU 
O get ew 1 nodet 70 D D D D 0 D D D D D D D D D D D 0 D ፤፡መበበበበበበበ[በ 
םםםםםםם‎ 
e [ get new 1 nodet 70 0 D D D D D D M000 stebn JI D D D D D 0 l] inode 
D DDD DD DDD DDD DD 0 DDD DD 0 DD D D D 0 D D 0 D በ D inode lock] (] 
OOO0000000000000000000000000000000000 ፤ጮ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםש םםםםםםםםםם‎ 
O00000000000000000000000000000000000000 
[] sb->s op read inodeO(] D 0 D D 0 D D D D D D 0 D D 0 0 D D 0 D 0 D D 0 0 
D 0 D DDD DDD DDD በ0 s op ead i node()0 000000000000000 
D 0 D Di state =I [፲፪] 0 ה‎ D D 0 D 0 D D 0 D D D 0 D D 0 D 0 
utu 


















































ELE ENE 














833 000000 


O0O000000000000000000000000000000000000 
OOO00000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
OOO00000000000000 
OO0O0000000004000000 
e I0000000000000000000000000000 VS000000 
COCO םםםםםםההפפ‎ 

e U UU UU DU 000000000 0 0 DD U D U 0 U D U 00 D U D 0 0 0 D U 
d cout D D በ NLD D D d inode] DD D D D D 0 0 0 0 DD D D 0 D 0 0000 0 U 
U U U በ U U D 0 0 0 D 0 0 0 0000000000 U 
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- D0000000000000000000000000000000U0U0U0 
d count D D D D D D D D הפוה‎ DD D D D D 0 D 0 D D D D D 0 0 000 DD 0 U 


U U U U 0 U D 000 U 


U U U 


U U U 



























































U U U UD U D 00 U D 0 U 


e U UU UU U DU 00 DU 00000 0 0 UU 0 0 U D U D 0 0 U D 000 000 U 
OOOO dine | OO ההתא‎ DD םםםםםםםםםםםםםםםםםםםם‎ 
םםםםםםםםםםםםםםיםםיםםםםםםםםםםםםםםםםםםםםםם‎ 
U U 


םםםםםםםםםםםםהאתםםםםםםםםםםםםםםםםםםםםםם 


e J00000000000000000000000 


e U UU UU DU 000000000 0 0 DD U D U 0 U D U 0 0 0 00 0 00 D U 







































































U U 0 U D 00 0000 000 U DU 0 U D UD U 00 U 0 D D U 0 0 U 
DOO000000000000000000000000000000 
U i count J0000000000000000000 MM D 0 0 0 L 


U U 0 U D U 0 0000000000 0 DD በ ሀ ሀ. ፲] U 


በገ U U U D 00 00000000 00 0 U DU D 0 U 
U Uu 
U U U U DU U 
U U U U DU U 
U U U U 0 U D 00 0000 U 
በበ በበ” OOOO0O0000000" 000000” 00000000 
U U U በ በ D 0 0 0 D U 0 0 0000000 00 0 በበ U 0 U DU 00 በሀ; 
U U U በ U U D 0 0 0 D U 0 0 0000000 00 0 [በበበ U 0 U DU 00 0 U 
በበበበበበበበበበበቨበበበበበበበቨበበሀበበበበ፤መበበበበ[በበበበ[;ቨ 
00000 dentry umused] ] nex [][] האש‎ D DU DD DD dv 000 
פםםםםםםםםםםםם‎ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםיםםםםיםם‎ 
[ i dentry 00000000 
00000 םםםםםםםםםםםםה הא‎ 
םםםםםםםםםםיםםםםיםםםםםםםםםםםםםםםםםםםםםם‎ 
*םםםיםםםםםםםםםםםםםםםםםםםים.‎ 


UD 0 0 D 0 0 0 00 0 U‏ בםםםםםםםםםים שםםםםםםםםםםםםםם 








UD 
U U U 
U U U 
U U U 
U U U 





























המא םםםםםםםם 








00000 dentry hashtable D D D D D D D 0 D 0 0 D D D D 0 0 0 00 DD 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
OO RAD D 0 0 D 0 D D D D d osh D 0 D 0 D D D D D hash D D 0 D 0 0 0 D 0 0 U 
U U U U D U D 0 0 0 0 U 00000 000 U DU 0 U D U [ሀ U U 
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םםםםםםםםםהההה 84 















































841 0000000 


OO000000000000000000000000000000 VS00000 




































































U U U U U 





file svat መዝይ D D DDD D D D 0 0 D 00 D D D D 0 00 DDD D D 0 0 


file systemtype[] 00000 fs. hD D D 0 D I 
struct file systemtype + 
const char *nane; 
int fs flags; 
struct super block *[] "read super] [] struct super block *, void *, int]; 
struct nodule *owner; 
struct file systemtype * next; 
struct list head fs_supers; 


file system type file system type file system type 


read super() | read super() 


file systems 


+] mm | 
read super) |“ ext2” 














iso9660 





በ87 םםםםםםםםםםםםם‎ 


U U U U D U D 0 000 U 
e nang] D D 0 0 D 0 0 0 D U D 0 0 U D U D 0 DU 


e fs flags] D 0 DD D D 0 DDD DDD 0 D 0 DD 0 DD םת‎ 
/* public flags for file systemtype */ 
#lefine FS REQU RES IEV 1 
#lefine FS ND OAOE 2 /* Gly dcache the necessary things. */ 
#lefine FS NOPRHIM  4/* prevent preloading of dentries, even if 
* FS NOIXXIE is not set. 
*/ 
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U U U U D U D 0 0 U D 0 0 0 0000000 0 0 D U D U D U D U 0 0 0 000 U 
U םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםפפט‎ 


U D D DD 00 file systemtype 0 DD D D D D 0 0 0 D DD D D 0 D 0 000 D 0 U 
በገ፲በበ ቋጩመበበበበበበበበበበበበበ[[በ[[ሀ በቪ D file systemtypeQ D O 


U 





U U U UD U U D 0 0 0 በበበ 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
00000000 & 700000000 file systemtypeQ 000000 file systens 


0 8700000000000000 300000 620 proc] 1809660 [] 












































#defi ne FS SINIE 6 /* Hlesystemthat can have only one superbl ock */ 
#defi ne FS NMIN' 16 /* Never nount fromuserl and */ 
#defi ne FS LITIER 32 /* Keeps the tree in dcache */ 
#define FS CD RENAME 32768 /* Tenporary stuff; wll go away as soon 
* as nfs renane] ] wll be cleaned up 


*/ 


በገ] U D U 0 0 0 U D uu 


01000000000000 epeQQO00000000000000000000 
הת‎ D D D D D 0 0 በ D 0 fs flags) በ FS האאאא‎ D D በ ፲; 
D2000000000000000000000000000 fs flags D Ú 
FS RAU RES DD םהה‎ 10000000 Bt] እጩ] ufs [J [] 
םםםםםםםםםםםיםםיםו בםםםםםםםםםםםםםםםםםםם‎ 
super_blockQ בםםםםםםםםםםםםםםםםםםםנםםהה‎ super block! [DO 
םםםםםםםםםםםםםםם‎ fs flag 00 FS 2 NED DDD 1000000000 
OOO000000000000000000000000000000000000 
e read ה‎ D D D 0 0 D 0 DD 0 D D D 0 0 D D 0 DU D D 0 0 D 0 00 0 U 


U U 0 0000 U 



































e next D D I ה‎ file systemtype הו‎ D DD 0 D D 0 D D 0 0 0 0 0 U 
file systems] PD000000000000000000 file systens lok[ OOOO 


U uuu 


[] 

OO file systemtypel] םםםםםםםםםםםםםםםםםםםהםהה‎ 
0000 הפצש‎ 0 UD D 0 0 0 000 D D D D D 0 0 (D 0 0 D 0 MII 
U D D D D 0 0 האפ‎ D 0 D D 0 D D D 0 0 0 0 DD DD 0 0 0 











e fs supers[][ OOO +2אתע‎ 100 D D D 0 0 0 00 D D D DD D 0 0 0 0 0 0 U 


U U 0 U D 00 0000000 U UD 0 U D U 0 0 0 U 00 0 00 0 0 0 0 D U 0 U D U 
DOO0000000000000000000000000000000000000 


U uuu 





U U UU 00 DU U UU DH D U U 0 00 0 U U 11 0 0 0 U 11711 


register filesystem] [] [| [] O [| ה‎ C] fs/super. cf] 


Ü ** 
ki register filesystem- register a new filesystem 
* @s: the file systemstructure 


* * * X * ጁ% * HE 


unregi stered. 
*/ 


Adds the file systempassed to the list of file systens the kernel 
is aware of for nount and other syscalls. Returns 0 on success, 
or a negative errno code on an error. 


The struct file systemtype that is passed is linked into the kernel 
structures and nust not be freed until the file systemhas been 


int register filesystem] struct file systemtype * fs[] 
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int res = 0; 
struct file systemtype ** p; 


if [] !፻5[] 
return - FNAL; 
if [| ፻5- next] 
return - EBUSY; 
INT UST HEAD] Sa fs supers] ; 
wite lock] 6፻11 6 systens lock] ; 
p =find filesystenl] fs- mane] ; 
if [ “pl 
res = - FERSY; 
else 
*p =fs; 
wite unlock] ile systens lock] ; 
return res; 


) 


find filesystem] | D 0 D 0 B B BL D D D D 0 0 D] 
static struct file systemtype “find filesystem] const char *nane{] 

{ 

struct file systemtype ግጩ 

for [ pile systens; *p; p=] *p] - next] 

if [] streng] [] *p] - nane, nan] = OJ 
break; 
return p; 


} 

U D DU 0 00 0 DDD D 00000 D DD 0 DD DD D D D D ቨ ቨ በ 0 wite lock] 

OOO000000000000000000000000000 file systemtype [] 
U DD DDD 00 DDD DD DD 0 D fs/super.c D unregister filesystent)[] D [ D] 
םםםםםםםםםםםםםםםם‎ O0000000000000000000000 
000-10000000 


[** 

* unregister filesystem- unregister a file system 

* @s: filesystemto unregi ster 

* 

* Renove a file systemthat was previously successfully registered 

ቾ wth the kernel. An error is returned if the file systemis not found 
2 Zero is returned on a success. 

* 

ች (ክር6 this function has returned the &struct file systemtype structure 
* nay be freed or reused. 

*/ 


int unregister filesystem] struct file systemtype * fs] 
t 
struct file systemtype ** tnp; 


wite lock] &ile systens lock] ; 
tmp = ile systens; 
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while [| ”trø] + 
if D fs =*tnp] + 
*tnp = 15- ext; 
፻5- next = NIL; 
wite unlock] ile systens lock] ; 
return 0; 


T 
top = &] *tnm|] - next; 


wite unlock] ile systens lock] ; 
return -H NAL; 
} 


842 0000000 


Dot‏ םםנםםםטםםטםםםםםםםםםטםםםםםםםםםםםםםםםםםם 
820000000000000000000000000 בםםםםםםםםםםםם 
O0O0000000000000000000000000000000000000‏ 
OO0000000000000000000030000000000000000000‏ 


O0000000000000000000000000 
$ nount -t 1509060 / dev/hdc / nnt/ cdrom 


RB Sob A ñ DI TERES BG PE Ge em ERN 
/mt/cdro םםםםםםםםםםםםםםםםםםםםםםםםהםםםםםםהההה‎ 
00000000000 
P0000000000000000000000000000000 vfsnount] O 
0 [] incl ude/1i nux/ nount. h0 O 
struct vfsnount 
{ 





struct list head mt hash; 

struct vfsnount *nmt parent; /* fs ve are nounted on */ 

struct dentry *nmt neuntpoint; /* dentry of nount point */ 

struct dentry *nmt root; /* root of the nounted tree */ 

struct super block *nmt sk / * pointer to superblock */ 

struct list head nmt nounts; /* list of children, anchored here */ 
struct list head nmt child; /* and going through their nmt child */ 
atomic t nmt count; 

int nmt flags; 

char *nmt devnane; /* Nine of device e.g. /dev/ dsk/hdal */ 
struct list head nmt list; 


i 

በበበ U U 0 UD 0 UD DUD 0 በ0 

e JO000000000000000000000000000000 mt hash 
U U U U 0000000 በበ 

° nnt nountpoint D D [] D D העש‎ 000000 dent D D 0 00000 
00000000 תה‎ 
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e mt parent D D 0 D 0 D 0 D D D 0 D D 0 D 0 D D 0 0 D 0 D D 0 D 0 D 0 0 U 
00000000000 התא‎ D በ በ vfsnount 00000 mt muts | mt child [| 
D D D D 0 D D DD השפ‎ D D D D D D D D vf snount [] [] [] mt child] D D 0 l 
vfsnount D D [| mt הפפ‎ D D D D 0 D D 0 D D D D D D D 0 0 D በ በ D D vfsnount 
000 mt הא‎ D 0 D D D D D 0 D D D D D D 0 D 0 D D 0 D 0 D D 0 D D በ [በ 

e mt הפ‎ 0 00000000000 supr blaock] 

e nt list] D vfisnont 000000000000 

D 0 D D 0 በ በበ ה‎ | D በ በ mt list 0000000000000 
U U D D D D 0 D 0 0 D D D D 0 0 0 0 D U 

D 0 D D 0 DDD D DDD vfsnont הנ‎ D D 0D D D mt flags linu/fs.h[] 
utut 

| These are the fs-independent nount-flags: up to 32 flags are support ed 

*/ 















































#defi ne Mb RXN Y 1 /* Munt read-onl y */ 

#defi ne M NBUD 2 /* Ignore suid and sgid bits */ 

#defi ne Mb NIEV 4 /* Dsallowaccess to device special files */ 
#defi ne Mb NEXEC 8 /* D sal l ow program execution */ 


#define M SYNIRNIS 16 /* Wites are synced at once */ 

#defi ne እይ RENOUNT 32 /* Ater flags of a nounted FS */ 

#defi ne Mb MNIOK 64 /* Allow nandat ory locks on an FS */ 
#define M NNI ME 1024 /* D not update access tines. */ 

#efine M MD >א דצת‎ 2048  /* D not update directory access tines */ 


#define M H ND 4096 
#define M MDE 8192 
#define M REC 16384 
#defi ne M VERRE 32768 
#define M AIVE 0 1«30] 
#defi ne NG NOLSER 0 1>31[ 


20000000000000000000000 םבםםםםםםםםםםםםם 

MNSODOOO 10 0 0 D D D D D 00000 D D D D sidg U‏ םםםםםםםםםם 

םםםםםםםהםההט do‏ םםםםםםםםםםםםםםםםםםםםםםםהם 
U U‏ 


מםםםםםםםת 


םםםםםםםםטוששא נבםםםםםםםםםםםםםםםםםטםםםםםםםם 
U U U U U UU D 0 U D 0 0 U D U D 0 0 0 DU 0 0 D U 0 0 0 0 0 0 0 0 0 D 0 0 U D U‏ 


RO IS 00 DD DDD 00000 DD DD 0000 U‏ םםםםםםםםםםםם 
םםםםהא םםםםםםםםםםנםםםםםםםםםםםםםםםםםםםםםהם 
aœ 0 00000000‏ ה root‏ בםםםםםםםםםםםםםםםםםםםםםהם 
D DD DD DD 0 D 000 0‏ הפשמ םםםםםםםםםהםםםםםםםםםםםם 
OOO00000000000000000000000000 neu root (70‏ 














































































































2J0000000000 


በገ] በበበ በበበገገበበበበበበበበገበገበበበበበበበበበገበበበበበበ[ U 
000000000000000 
በገ] 000000000 0000000000 000000000000000 
OO mount] | | ገ ה0אם‎ D D 0 D D 0 D D D D 0 0 sys nontOOO000 
fs/ nanespace. c [] [] 
asminkage long sys neunt(char * dev nane, char * dir nane, char * type, 
unsi gned long flags, void * data] 
1 
int retval; 
unsi gned long data page; 
unsi gned long type page; 
unsi gned long dev page; 
char *dir page; 


retval = copy nout options [] type, Stype page] ; 
if [] retval < OJ] 
return retval ; 


dir page = 01960] dir nanef] ; 
retval = PIR FRR] dir page] ; 
if [] IS ERR] dir page] [] 

goto out 1: 


retval = copy nount options [] dev nane, Sdev pagel : 
if  retval <Q] 
goto out 2; 


retval = copy nout options [] data, &data pagel] ; 
if [ retval <0] 
goto out3; 


lock kernel] [D ; 

retval = do neunt[]|] char*{] dev page, dir page, [| char*[] type page, 
flags, [] voi d*[] data pagel ; 

unl ock kernel [] [] ; 

free page[] data pagel] : 


out 3: 

free pagel] dev pagel] ; 
out 2: 

putnang[] dir pagel] ; 
out 1: 


free pagel] type pagel] ; 
return retval ; 


} 
U U U U D U D 000 U 
- 00 dev na J00000000000000000000000000000 
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U DD DDD 00000 D 0 DD D dr ne 0 0 0 0 0 D 0 DD 0 0 D 00 በ type 
OO0000000000000000000" EtZ" በ" MDP" OOO flags 
U D DDD DD data D 0000 0 0 D 000000 DDD 0 D התא‎ 

° copy nount options] DO ה(‎ 0 0 D 0 0 0 0 0 0 D D 0 0 0 D 0 D D D 
O0000000000000000000000000000 getnane()[] 0 D LU D Ú 
NOON O NO DD DDD 0 D 0 D DD copy neun options] OOO 
O00000000000000000 

בםםםםםםםםהםהםהםהההה ה( ה( do‏ םםםםםםםםםםם 
U D NT D DL D 0 0 D do nmunt()[] 00000 fs/nanespace. c [| []‏ 
































long do nount[] char * dev nane, char * dir nane, char “type page, 


d 
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unsigned long flags, void *data pagel] 


struct nanei data nd; 
int retval = 0; 
int mt flags = (0; 


/* 1150800 nagic */ 
if NN flags & M; MC MK] =M MC VAL] 
flags & M MC MK 


/* Basic sanity checks */ 


if [] !dir_nane | | !*dir nane | | !nenchr[] dir nane, 0, PAE SIZE] D 
return - FNAL; 

if [] dev nane 88: !nenchr] dev nane, O, PAE SIZE] D 
return - FNAL; 


/* Separate the per- nountpoi nt flags */ 
if D flags &M NSUN] 
mt flags | = אא‎ NSUD 
if ה‎ flags &M NIH 
mt flags | = MN NIEV 
if [] flags & M NET 
nnt flags | = MT NEXEG 
flags & +] M NSU D M NEX M NIH ; 


/* ... and get the nount point */ 

if D path init] dir nane, LOKP RALGYLAKEP PATIVE Sad] 0 
retval = path val k] dir nane, &nd] ; 

if [] retval [] 
return retval : 


if D flags & Mb R MINI] 
retval = do renount[] &d, flags &26 FREMONT, mt flags, 
data pagel ; 
else if |] flags SM HNJ 
retval = do loopback] &nd, dev nane, flags & M RAT ; 
else if |] flags SM MVH] 
retval = do nove nount[] &nd, dev nanml]; 











else 












































retval = do add nøunt[] 6ክቢ type page, flags, mt flags, 
dev nane, data pagel : 


path rel ease] &nd] ; 
return retval; 


U U U U D U D 0 0 U D 0 000 U 
እይ MC VAL. [] NG MC MK D D D D D 0 0 D 0 0 D D 0 D 000 DD DD 0 0 0 
U U U በ በ U D 0 0 0 D U 0 0 0000000000 U D U 0 U U U 

ir nane[] dev nane[] D D I 0 0 DD D ^ D dir rare” [] “ !*dir nane" 
OOO00000000000000000000000000000rmrO00000 
OO000000000000000000000000" 00 םםםםםםםםםםם‎ 
בםםםםםםםםםםםםם‎ dev ne D DD D] Ú 


U U 00 U 


OO flags 

















בםםםםםםם 


° 00 flasO0 SANTONG 000000" 00”O0000000000 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
OOO000000000000000000000000000000000000/dev 
dev/loopO[] /dev/loop1Q 0000000000 do loopback] 0000000 








DUDU/ 
U U U U U 











OO flags 


U D D 0 0 D 00 do move not 00000000 


U Uu 



































M NSUD] እይ NEXECI] M Nyo 300000 flas[O 000‏ ם 





U D D 0 0 DDD DD mt flags 0 
00 pathinitQ OO path vali 0000000 centryQ D D ם‎ HD D dentry 
U D D D 0 0 00 D ה‎ dentry[] DUU 


OO האאא א‎ D D D 10 D D D D 0 0 000 DDD D 0000 U 





do renun‏ בםםםםםםםםםםיםםיםםםםםםיםםיםםםםםםםםםהם 

















OO N MARD D D 0 ዝበበበበበበበበበበበበበበበ[በበ[;ቨ። 





0 3000000000000000000000000000000 


00000 do add mount] OO D D 00000 do add nout D D 000 do kern mount 


OOO00000000000000000 fs/super.cOO 
struct vfsnount “do kern nount[] char “type, int flags, char *nane, void *data[] 


d 


struct file systemtype * fstype; 
struct vfsnount *nmt = NIL 
struct super H ock *sb; 


if וח‎ 


/ች ve 
if p! 


[5 us 


type || !nenchr[] type, 0, PACE SIZE] 1 
return ERR PIR] - H NAH] ; 


need capabilities... */ 
capabl ef] CAP SYS ADMIN] [] 
return ERR PIR] - EPERNI ; 


filesystemdriver... */ 
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fstype = get fs typel] type] ; 


if  !fstypel] 
return ERR PIR] - ENIEV] ; 














/* ... allocated vfsnount... */ 

mt =alloc vf snmt|[] |] ; 

if] nt] + 
nnt = FRR PIR] - EN MENI ; 
goto fs out; 

› 

set devnane[] nmt, nane] ; 

/* get locked superbl ock */ 

if [] fstype- fs flags & FS HU RES DM] 
sb = get sb bdevi] fstype, nane, flags, data ; 

else if [ fstype- As flags & FS SNIH] 
sb = get sb single] fstype, flags, data[]; 

else 
sb = get sb nodev[] fstype, flags, data]; 


if በ] IS ER] sh] [| + 
free vfsnnt[] nnt[] ; 
nm 一 struct vfsnount =[] sb; 
goto fs out; 


› 
if [] fstype fs flags & FS NMINI] 
sb >s flags |= M. NISER 

mt- =mt sb = sb; 
nnt--nmt root = dget[] sb + root] ; 
nmt--nmt nount poi nt =nmt->nmt root; 
nmt- 21. parent = mt; 
up wite[] Ssb መ unountD ; 

fs out: 
put filesystem] fstype] ; 
return mt; 


} 
U U U U D U 0 U D U 
e [00000000000000000000000000000000000 
U U U 
e get fs type] 0000000000000000 file systemfile] 00000 
U U U U U 
e alloc_vfsnmi] 00000 ה‎ 000000 vfsmut 0000000 omt D [J 
U U U UD U D 00 U D 0 U 

° set ₪ 000000000 

- DDD DDD DDD DDD DDD DDD DD DD DD DDD fs flags OO 
FS RAU RS DD D D 0 1 D D D D D 0 D 0 D D D D D D በ Bt] mxD DD np 
בםםםםםםםםםהםם‎ get sb bd] 00000000000000 

e OO fsflasO0 FS 2 NED NOO 10 DD 000000 DD DD 0000 U 
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በ1100900 U 


* CODE 





U U U U 00 U 








OOO000000000000000000000010"00" uD 






































000 get sb single] 0000000 super הא‎ DDD DD D D 0 00 0 DDD U 
0000000000 20000000000000000000000000 


| |] | | fs flags 0 | FS NMIN[ FS RURE LE] [| FS SINIE 


በበበ.በ8 םםםםםםםםםםםםםיםםםיםםםםםםםםםםםםםםש‎ 


በበበበቨ[፲በበበዐበሀበሀሀን ንበ በበበ U U DUD 0 0 DD 


get sb nodev] D D 0 D D 0 super_blockQ O00 


e םםםם‎ 


O 0 fs flagg] FS NONTON םםםםםםםםםםםםםםם‎ 








000000000 א‎ NSRD 00O 10 

° mt-xmt sb D D D 0 D D D D D 0 0 sbi nt->m rot J 000000 
b-»s root] dget NOOO dentryQ 0000 count O 10 nmt- Sant nountpoi nt | [] [] [| 
U U UD D በ በ ₪ ₪ parent D D D D D D 0 D D D D 0 D D D D D 0 D D D D 0 0 D U 
U U D DD 0 0 D 000 0 U 


000000 do add neunt[] 00000 
static int do add neunt[] struct nanei data *nd, char “type, int flags, 


int mt flags, char *nane, void *data[] 


struct vfsneunt *nmt = do kern nount[] type, flags, nane, data[]; 


int 


err = PIR ERR] mt[] ; 


if [ IS ER] ጩ00 


goto out; 


down] Snount sen] ; 
/* Sonething vas nounted here while ve slept */ 


wil 


err 


ef] d_nount poi nt[] nd- entry] && follow dowy] &nd- 2081. &nd- ent rv [] 


=-HNA; 


if D !check mt nd >mt[] 0 


goto unl ock; 


/* Refuse the sane filesystemon the sane nount point */ 
err = - P EY; 
if [] nd 2081- 2nmt sb = mt- nt sb & nd- >nmt- 2081 root == nd »dentry[] 


goto unl ock; 


nnt--nmt flags = mt flags; 
err = graft tree] nmt, nd]; 


unl ock: 
up] Snount sen] ; 
nmt put [| nmt[] ; 
out: 
return err; 


} 
U U U U D U D 0 000 U 


- DOOD 


do kern חצ‎ 0 0 D D D D D D 0 0 0 0 DU 


° [] do nunt QD 0 D Dath 11()በ path הא‎ D D D D D D D D በዐ dentry 
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D0 D 18006 0000 חפט‎ D D D D D D 0 0 UD naneidataQ 0000 nd HDD 


do add nowt OOD 0000000000 


e 0000 do kern noun DD D D D D D D D 0 0 0 0 DD D D 0 0 0 0 0 D D DH 
DOO0000000000000000000000000000000000000 
מםםםםםםםםם חש םםםםםםםםםםםםםםםםםםםםםםםם‎ 
OOO0000000000000000000000000 ו‎ D 0 D D D D 
D D DDD DD DD D D D wile[ NOD DD 000000 DD 00000 DD DD 0 0 0 











e J00000000000000000000000000 


e DO graft tree 00 mt DDD DD 0 D 0 00 0 D D D D 0 0 


e U UU UU UU DU 0 UU U 


843 0000000 






































U U 0 U 0 000000 00 0 UD U 


65 0000 


























604800 /* 
604800 /* 



































በበበበበበበበበ በበበ በ" 00 U 


[| 
בםםםםםםםםםםםם‎ 
O incl ude/li nux/ quota. h[] 


[] 
U U DU U 
U U U U 














[] 
[] 
[] 
[] 








000” uu 


[] 
[] 
[] 
[] 
[] 


[] 7*24*60*60]] 
O 7*24*60*60]] 


በገ ገበ በ U D 0 0 00000000 DDD U ሀ ሀቨ 
U U D 0 0 0 6nsQQ0000000000000 





U 


























በ ፲ ם‎ vfsmilist D D 0 00 D D D D D DD 0 fs/super.cQ [] sysy_unount 


























ana ACE 
ExI 
El 
EI 
EE 
Oo 
בם‎ 


U U 0 U D U 





O nx 0 0 0 0 D 











DOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 


OOO00000000000000000 inclue/linux/ quota.h[] 1 1 D D 
struct dgblk 1 
u32 dqb bhardimt;  /* 0 



































. u32 dgb bsoftlimt; 

. u82 dgb curbl ocks; 

W32 dbihardinit; / 

__u32 dob isoftlinit; / 

__u32 dgb curi nodes; / 
tine t dqb bti ne: /ፆ* ቨ 
tine t dqb iti ne; חם*!‎ 

i 


በበበበበበበበበሀበበሀበበበበሀበበ[በበበበበሀ[በ 44000 
incl ue/ li nux/ quota. hO 0 1 1111 D 0 D D D [ 
struct dquot 1 
struct list head dq hash; /ጠበበሀሀበ” 
struct list head dq i nuse; /ማበገበበበበሀበበበበ[በበበ” 
struct list head dq free; !* 0000000000 * 
wait queue head t dq wit lock /* *םםםםםהםהההההה‎ 
wait queue head t dq wait free; /* *םםםםםםהההההה‎ 
int dq count; םםםם*!‎ v 
/* fields after this point are cleared when invalidating */ 
struct super hlock *dq sb; /* superblock this applies to */ 
unsi gned int dqid /* IDthis applies to[] uid, gid] */ 
kdev t dq dev; /* Device this applies to */ 
short dq type; /* Type of quota */ 
short dq flags; /* See IQ * */ 


unsi gned 1000 dq ref erenced; /* Number of tines this dquot vas 
referenced during its lifetine */ 















































struct dqhlk dq dgb; /* Dskquota usage */ 

L 

U D DD D 0 D 0 D 0 D 0 D D 0 D D D DD 0 0 D D D 0 0 D U 

VS U 000000000000 dut DD 0 DDD DD DDD D 0 0 DD 00 0 0 
U D D DDD ₪ D D በ በ O א‎ D 0 0 0 0 0 0 D 00 0 D 0 D DD 00 DDD D D 
000000000000 םםםםםםםםםםםםםםה‎ 

U D D D 0 0 D 0 D 0 00 D D D DD 0 D D 0 D D 0 D D D D 0 D D D D 0 0 D UD 
U D DD 0 0 D DD 00 DD DD D D D D D 0 D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 
U D DD 0 0 D 000 DDD 00 DD DD 0 D D D 0 U 

בםםםםםםםהםםםםםםםםטםםםםם 

010 00/etc/fstab הה‎ D 0 D 0 DDD DD 0 D 0 0 D 0 D 0000 0 

/ dev/ hdal / Ext2 defaults 1 1 

/ dev/ ከ082 /hone Fxt2 defaults 1 2 

O2000000 vsert) OG בםהםהםהההההםההההההה הט‎ 











[]/etc/fstab] 0000000 
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/ dev/ hdal / Fxt2 defaults 1 1 
/ dev/ hda2 /hone Ext2 defaults,usrquota 1 2 


0300 rot D 0 0 D D 0 0 D 0 D D 0 0 D D 0 በ D D quota user] 
Ht ouch / hone/ quot a. user 


#chnod 600 / hone/ quot a. user 
በጣበበበበበ[በ 


DOO00000000000000000UUU000 
# edquota -u user1 

Quota for user userl 

/ dev/ hda2: blocks in use: 10, limits [] soft 24000, hard=5400]] 
inodes in use : 400, limits [] soft 4200, hard=1600[] 


OOOO limtsOOOOOOOOOO 
[] #pota meer? D ] D D H vsert JO00000000 


66 111111] 


file systemtypeQ n 0 DD D D D fs flags]‏ םםםםםםםםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 በበ U D U D U 0 U D 0 0 0 U‏ 
U U 0 D UU 0 00000000 DD 00 0 0 DD በ Ét{ Mm x 0 III 0 D OD 0 0 U‏ 
D D DD D D D D 0 D 0 0 D D D D 0 0 0 D D nna) DB d 0 0 UD‏ הפס OOO‏ 
kern nomtQO OOO‏ 0000 


D 0 DD 0 DDD D DDD D file systemtypeQ תת םםםםםםהה‎ 
#defi ne DECLARE FSIYPH] var, type, read, flags] ላ 
struct file systemtype var = { \ 








nane: type, \ 
read_super: read, \ 
fs flags: flags, \ 
ower: THS MILE | 


) 


#defi ne THO ARE FSTYPE DEV] var, type, read] V 
DECLARE FSIYPH] var, type, read, FS EQU RES TEV] 
םםםםםםםםםםםםםם‎ ፤ጨልጨዱ Sree LRN םםםםםםםםםהה‎ 
FS RAI RSS הא‎ [00 10000000 GOO0000000000000000 
000000 ÆA FIVE D 0 D D 0 D D D D D fs flags t] I D U D 


861 000000 pipefs 


pi pefs ] םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ 
O0O0000000000000000000000000000000000000 


000000 fs/pipe.cOO 
static DECLARE FSIYPE] pipe fs type, "pi 9675". pipefs read super, 
FS NMIN] FS SINGH] ; 
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static int init init pipe fs] void] 
{ 
int err =register filesystem] Spi pe fs type] ; 
if [] err] + 
pipe mt = kern nount[] Gi pe fs type] ; 
err = PIR ERR] pipe mD ; 
if [] IS ER] pi pe mt 0 
unregi ster filesystem] Spi pe fs type] ; 
else 
err =0; 
} 


return err; 


እ 
static void exit exit pipe fs[] void] 
{ 


unregister filesystenh] Spi pe fs type] ; 
| nntput[] pipe nmt[] ; 
nodule init[] init pipe fs[] 
nodule exit] exit pipe fs] 
pi pets D D D D 0 0 D 000 0 0 0 D D DD D rddein=t(] 00000000000 
nodule sit] D D D D D D D d D D DDD DDD D 0 0 DD 000 0 
U DECLARE FIERT D D D D 0 በ 0 D 0 האפ‎ D D D 0 FS NMAN] FS SINTE 
በበበበ Q0000000000000000000000000000000000 
D [ በ በ US ጃእ፲ጀ፻በ D D በ በ [ በ በ register filesystent D] 000000000 
0000000 kern 0 ה‎ D 00 
regi ster filesystenf)[] [| 0 pipe fs type] 00 file systens 70000000 
በ] D [] D /proc/filesystens 0 0 " pipefs” 0 D D] BL D [ 0 nodev" [10 0 D D 0 D ü 
FS BU RES TEV D D D D BH B. DD D D 0 DD C. CIO. U 0 
kern neunt()[] [| ה‎ do nout OOD D D D | הת‎ D D 0 D D 0 0 D D 0 0 D 0 0 
110 unregister filesystenÿ] [| | pipe fs type] file systens [] OO000 
OOUppfsooOO000000000000000000000000000000 
pipefs בםםםםםםםםםםםההטאת םםםםםםםהםה ה‎ sys m peOU [000 
U D D D do 0 םםםםםםםםםםההה הת םה םהםםהםההההה‎ 
U U 












































int do pipe] int ሣሟ] 
{ 


struct gstr this; 

char nane[ 32]; 

struct dentry *dentry; 

struct inode * inode; 

struct file *f1, *f2; /* 
U D 0000000000 0 
uv 


םםםםהה6ום 


םםםםםםםםםםםםםםםם 
OO000000000000000000f10£2‏ 
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int error; 
int i,j; 
error = - ENTIE 
fl =get empty filp] D : /ሣበበበ ሀሀ በበበ በ1600” 


if D !f1p 
goto no files; 


12 - get enpty 7111] [| ; 
if [] !፻21] 
goto close 1 


inode =get_pipe inode] 0; /00000000 האפ‎ D 0 D 0 DD D D D 
D DDD DD DD 0000000 DDD 0 D 0000 [በ በ ፤ጭጩመበበበሣ 


if [] !i node] 
goto close 2 
error = get unused fd] [] : በ*በበበበበሀ በበ” 


if [] error x0] 
goto close 112 inode; 
i =error; 


error = get unused fd] [] ; 
if [] error <Q] 

goto close 112 inode i; 
j =error; 


error = - EN MIM 

sprintf nane, "[9bu]", inode-3 ino]: 

this.nane — nang; 

this.len = strlen] nam] ; 

this. hash =1ኽ00ፁ ב‎ ino; /* wll go */ 

dentry =d 811 08 pipe mt- am sb >s root, 66457 /ች ፲116[] 700000 f dentry 
00000000000 dentryO O00 dentryp D D D ሀ ሀ ከ ከ ሀ ሀ inodh 00 D 000 dalloc() 
בםםםםםםהםםםם‎ fileN D *םםםםםהה הוה‎ 


if D ! dentry[] 
goto close 112 inode i j; 
dentry->d op = &pi pefs dentry operati ons; 


d add] dentry, inode]; [ግ] 0000 ind JO0000000000009 

114 vfsnmt =12 2 vfsnmt = nmtget[] mtget] pipe nmt[][]; /* pipe nmt 000 
init pipe fs) 000000 vsnom | D D 0 D D 0 D D 0 D 0 0 D 0 0 D 0 0 D 0 0 D 00 D 
መፎ '()11] D D 0 ] በ 2 ኻበ 


f1->f_dentry =f2-# dentry = dget[] dentry]; 0*0000000000 f dentry 0 
םםםםםםםםםםםםםםםםםםםםם‎ TD 


/* read file */ 
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f1->f pos =12 ጃ pos = 0; 
f1->f flags =O RXN Y, 

f1- op = &read pi pe fops; 
፻1- ሟ node = 1; 

f1- version = 0 



































/* wite file */ 

f2- flags 0 WANY; 

f2- op = &rite pipe fops; 
f2->f node = 2 

f2- version = 0; 


fd install[] i, fll]; בםםםםםםםםםםםםםםםם‎ 
በበበበ[በበበበበበበበበበበበበበበበበ[በበበሣ 


fd 118817 j, f2]: 
fdol =i; 040 ፻፲ጠ0 
fd 1] =j; O*00 fall 


return O, 
በጠበበበበበበበበማ 
close 112 inode i j: 
put unused fd] 10 ; 
dose f12 inode i: 
put unused fd] i[] ; 
close 112 node: 
free page] [| unsigned long] PIPE BASH] *i node] [| ; 
kfree] inode- >i pipe]; 
inode > pipe = 1; 
i put] inode] ; 
close f12: 
put filp] fa; 
close f1: 
put filpg fig; 
no files: 
return error; 


T 
OOO00000000000000000000000 2400000700 
ם‎ Q מא‎ D D D 0 0 0 D "^ 000 0 WNTD D 0 0 0 0 D D D 0 0 DDD 00 N 


read pipe fops[] wite pipe fops 0000 pipe. c D (] 
struct file operations read pipe fops = + 


1] seek: pi pe lseek, 

read: pi pe read, 

wite: bad pi pe w 

poll: pipe poll, 

ioctl: pipe ioctl, 

open: pi pe read open, 
rel ease: pi pe_read rel ease, 


L 


struct file operations wite pipe 1008 = 1 
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llseek: pipe lseek, 


read: bad pipe r, 

write: pipe wite, 

poll: pipe poll, 

ioctl: pipe ioctl, 

open: pipe write open, 

rel ease: pipe_wite release, 


L 

[ read pi pe fo] 000000000 bad pipe W D D D wite pi pe fops[] [J 
00000000 bed pipe ro HO000000000000000000000000 
O000000000000000000000000000000000000000 
U D D 0 DD הפו‎ D 00000000000000000000000000000 
OOOO file inode] השא‎ 00000000 


862 UD [በ] HS 


HS] Berkeley fast File System] 0 0 DD D D D 0 0 D 00 D D D D 0 0 0 0 U 
000000000BSO00000000000000000000000000000 


000 ዝ] 20000000 RSD 0 D በ በ በ በ በ fs/hbfs/inode.cQ D 
static DECLARE FSIYPE TM] bfs fs type, "bfs", bfs read super[] ; 


static int init init bfs ፻5[ void] 
{ 


return regi ster filesystem] &fs fs type] ; 
› 


static void exit exit bfs fs] void] 

: unregister filesystenh] Sbfs fs type] ; 

› 

nodule init] init bfs fs] 

nodule exit[] exit bfs fsp 

[] PETAR FSIYPE הא‎ bfs fs האש‎ OO D D D םם‎ D FS REU RS MOO 
aD D DDD DDD DDD DDD 0 U 

DDD register filesysten] በ በ WS 0 D 0 0 0 D 0 D D በ‏ םםםםםם 
unregi ster filesystemy | 111111] 1 E []‏ 

U U DD DD UD os 0 0 D D 11 11-11. GE 0 0 0 D 0141 D D UD מים םייט‎ D U 
fs type read super()0 00000000000 RSD D D D D D D fs/bfs/inode. c 


በ] በ] bfs read 0 ה‎ DD DDD D UU 
static struct super block * bfs read super[] struct super block * s, 


void * data, int silent] 
OOOO s000 super םםםםםםםםםםםםםםםםםםםםהםהםהם הא‎ 
םםםםםםםםםם‎ s dev DD 0 DD DD 0 DD 0 DDD DDD 0 D 0 DD 00 00 0 
U U D 0 D 0 D D D 0 D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 
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U D super block] ] D 0 DD D D 0 0 data dd DD OD D 0 D 0 00 D ESI OO 
በበበበበበበበበበበበበበቧበ ዉ1በመበበበበበበበበበበበበበሀ 0 0000 U 
0000 
הפצ םםםםםםםםם‎ DDD DD fs/super. c0 [ read super()[] rend super 
በበበበበ በበበ SON 0 0 DD 000000000 U 
O00000000000000000000 /00000000000000000 
OOOO iget(sh הגע‎ 0 D DD DD DDD 0 0 000 000 D D DD D D D 0 0 0 
inode D D D D D | inode 0 D 0 0 0 0 0 0 0 0 0 D 0 0 0 0 D 0 D inode å 1 
inode 3 fol 0000000000 0 inode x fæl ה‎ file op] 

































































57 מ טיפ טיט טי‎ Hl 


U U U U D U D 0 0 0 D 0 0 00000000 0 DD U D U 0 0 0 U 


8.7.1 open [] 1 1 0 


U U 0 U D U 0 0 0 000000 U D 0 U D U 0 U D U D U 0 oead D 0 0 U D U 
U U U UD U U D 0 0 0 0 U 0 0000000 U DU 0 U በከ U 
U U U በበ U D 0 0 0 D 0 0 0 0000 00 U 0 U D U 0 0 0 000 U DU 0 0 U UD 


00000000 ה D sys open)D D‏ 0 םםםםםםםםם 
asmi 9806 long sys open] const char * filenane, int flags, int node]‏ 
{ 
char * tmp;‏ 
int fd, error;‏ 


41 BITS PER LOG != 32 
flags | = LARFHLE 
Hendi f 
tnp = get nanef] fil 608081] ; 
fd = PIR HR] tnu] ; 
if D 115 ERA] to] 0 + 
fd = get unused fd] [] ; 
if [] fd > 0] í 
struct file *f =filp open] tnp, flags, node ; 
error = PIR FRR] f[] ; 
if [] IS ERR) ff] D 
goto out error; 
fd install[] fd, f[] ; 
› 
out: 
å put nane[] tnpl] ; 


return fd; 
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out_error: 
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put unused fd] fd] ; 
































0000000000000000 300000 


U U U U 


00000 םםםםםםםההצסס‎ open()[] በ 


U U 0 U D 0000000000 000 UD bu 


fd =error; 

goto out; 
} 
100000 
[] 1] fil 606081] U D DD 0 0 00 U 
[] 2] flags] 
O RNY םםםםםםםםם‎ 
OVRNY םםםםםםםםם‎ 
O FOR U D D D 0 0 D 0 በ በ 
U D D D 000000000000 
O GREAT OOOOOO000000000000 
O EG. 
O IDN םםםםםםםם‎ O 
O APPEND በበ wit 0000000 
00000000 40 
O NUTTY 00000000000 
ONNIGK 





[| open()[] read()[] 60 D [] [| Ú 


OOOO00000 0 (nl ude/ sem 386 fcntl. h0 D D Ú 

0 3] node] N םםםםםםהםםםםםהםהםה‎ open) 000000 DD D D 0 0 0 0 D 
OOO0000000000000000000000000000000000000 
OOO000000000000 


S I RER 
S DER 
S IXLER 
S IRR 
S IWR 
S IXGP 
5 IROIH 
5 IWH 
S IXOIH 
































o 
L1 


o 


o 
E 


ET FET 





U U U D 11] /include/li nw stat. h[] 000 


200000 


U U U U D 0 0 U D U 
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U U 


U U 


U U 
U U 








U U 












































DOUDOU 
sys open] D ፲ ם‎ filp open ה 000000 ה‎ D D D D 0 0 0 0 D 


U DDD DU file strut NAN fdOOOOOO 10000000000 filed 
U U 0 U D U 0 00000000 000 U 
U D DDD 000 DD DD DD 0000 DD D D በ 8190ቨ በ O O met I 0 D D 
םםםםםםםםםםםםם‎ PRENI 00 19 EO 0 0 000 D D D D 0000 U 
U U 








8.7.2 ₪ 


U D D D pon D D D D 0 0 0 DD D D D D D 0 D הצאצאס‎ ORIMONOODO 


OO read] D D 00 D 0 DD 0 D DDD D DDD 0 fs/read wite.c[ O00 
asmi 9806 55120 t sys read] unsigned int fd, char * buf, size t count] 
1 

58126 t ret; 

struct file * 6 


ret =- FNF; 
file =fget] fd] ; 
if [file] + 
if ה‎ file-> node & FME READ] + 
ret = locks verify area [] FLOCK VER FY READ 


file A dentry- >d i node, 


file, file- pos, count] ; 
if ה‎ !retg + 
58126 L ] *read] [] struct file, char *, size t, loff t *[]; 
ret =-HNAL 
if [] file + op &[ read =file- op read] != NU] 
ret =read] file, buf, count, &ile--f pos[]; 
T 
T 
if D ret 50] 
dnotify parent] 1116- + dentry, DN AGCESS] ; 
fput[] filed; 


return ret; 


} 
100000 


בםםםםםםםםםםםםשיםם 
םםםםםםםםםםםםםםםםםםםםםםהםההאאתתם 
D D DD D 0 0‏ הש ፲]‏ 0 
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200000 


O000000000000-M000000000000000000 count |] [J 
U U U UD U U D 0 0 0 D U 0 0 0000000 NOD D U 0 U D U D U 0 U D 0 0 0 U 
םםםםםםםם‎ di 


A) D D 0 0 


01000 0 םםםםםםםםהםהםהא 000000 ם‎ leù በበ 

02 00000000 file [I00000000000000000000000 
OOOOOO f ps DDD ጩ(በበበበበበበበበ[ሀበበ”በበበ”በበበበበበበ[ 
locks verify area] 0 0000000000 fs.h[] l 

D3000000000000000000000000000000000000 
UO0000000000000 file operations ה‎ 000000000000000 2 
DU DD DD DD DD DD DD DD DD በበ በ Et2 file operations] (] D U በ 
Ext2 dir operations D 11111 1 0 0 0 D D D 0 0 DD DD D 0 0 DD B C] D LU CI DI 
0000 fle D 00000 DDD DD D 1. D በ በ በ generic file read] 00000 
[] nmdfil enap. ር [] [| 
በ 00000000000 ጠበ[በበበበበ dotify parent] (] (1 በ D D D [ 
00000000 file] በ በ inode) D [J 

















8.7.3 fentl OOOO 


fs/fcntl.cOOOO‏ בםםםםםםםםםםםםםםםםםםםםםםםםםם 
100000 


DN td D D D 0 D 000000 U 

020 cm 0 0 000 DD D D 000 DD DDD 0000000000000 500 
F OPFD] F CEIFD] F SEIFD] F GIFL[ F SEIH. 

Dag 000000 םםםםםםםהשש‎ 


2J0000000000000c6n00000000000000 








A) D D 0 U 


መ D OO F DOH D D D D 0 D D DD DDD 0 DDD D D DD‏ םםםםםםםם 
OOOO arg DD arg U 00000000 fentl (fd) F OPH) arg files struct []‏ 
e&9000000000000000000000 fdd DD 000 0 00 D‏ 000000 
U D 0 D 00 D 00000 U‏ 

U U [| [] [1 cnm ה ה‎ | EŒ ה‎ J files struct [] [] close on exec] [| [] 
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םםםםםםםם 

U DU D 0 0 D cm] O00 םםםםהםםםהההשצתת‎ ag D 0 0 1000 
close on exec[] [| 00 [] [] close on 66611] 

ed 0 ጀ፻ጩመ]በ1በበ000 open] 0 DD 0 DD 00 DD 0 DD D‏ םםםםםם 
D D D D D 0 D D 0 D D 0 D 0 0 D‏ ואש D D D DD D DDD ORANY OWN O‏ 
፻11ፀ[ D በ flags 0 በ‏ 00000000 

U D D 0 DD ed] D D 0 F SET OOOO הפפ‎ 000000000000000 
םםםםםםםםםם‎ OAPPENDG ONNTOKN D 0 D D 0 0 D 0 0 0 D 0 0 0 0 arg 
0000000000000 00 DD DD DD DD DD -10 DD 0 0 0 











8.8 Une 24000000000 


[1981110100 22x000 24x00000000000000 2.2.x0 000 
OOO 24x0000000000000000 


םםםםםםםםםםםת 


DOOOO0O000000000000000000000000000000000 
nyt s[T] 
static struct file systemtype nyfs fs type - 
+ "nyfs", FS REQUIRES DEV nyfs read super, NIL L 


. initfunc[] int init nyfs fsQ void] | + 
return register filesysteni] &wfs fs type] ; 
1 


#fdef MILLE 
EXPORT ND SYMBCLS; 


int init nodule[] void] + 
return init nyfs fs[][]: 
} 


void cleanup nodul ef] void] + 
unregi ster_filesysteni] Snyfs fs type] ; 
} 
#endi f 
O D D MDIN LRE ON | | D | በ D D read ፍጩሯ()ቨ[ በ D በ በ በ MK 
USE CONT] ot 90 ה‎ D 0 0 U 0 0 0 D b B 0 D D D D D 
static 1፲11 ARE FSIYPE DEV] nyfs fs type, "nyfs", nyfs read super[] ; 


static int init init nyfs fs] void] + 


return regi ster filesysteni] &wfs fs type] ; 
T 


— 339 - 









































Ol Linux [ ul 














static void exit exit nyfs fs[] void] + 
unregi ster filesystem] &yfs fs type] ; 
} 


EXPORT ND SYMBCLS; 
nodule init] init nyfs fs] ; 
nodule exit] exit nyfs fs] ; 


MD XXX UE הא‎ በ TSD D 0 0 0 D D D DD 00000 DD DD 0000 U 
በገ በ በ በ D 00 0 0000000 00 0 U D U 


41 D 000000 large Hle Support[] LES] 


VEST D [ [| 400000000 ፳86 | ጩፎርቨ l [T| 

° 00 64000 t 

s םםםםםםה‎ 6400 getrlimt OG setrlimt 000000 
e gibo] 00 getrlimt64) በ setrlinit64] [T] 


םםםםםםםםתת 


0000000000 
if በ !ዉ፲ || !dir-3 ning + 








*err = - FPERM 
return NII; 
} 


D 0 DD 0 DDD D DDD 0 0] ERR PIR), PIR ERR) በ IS ERU D U 
if []!dir || !dir-3 ning 
return ERR PIR] - EPERNI ; 
000000000000 include/linux/fs. h[] [J 
static inline void "ERR PIR] long error] 
{ 
return [] void *] error; 


} 
static inline long PIR FRR] const void *ptr] 
{ 


return [] long] ptr; 


} 

static inline long IS ERR] const void *ptr[] 

{ 

return [] unsigned I ong] ptr 5 [] unsigned long] - 10001, 
} 
4] inode] [] 
OOOO [file operati ons [] inode operations] [1 (] D] B] [[] [| B]. םהה‎ D]. [] [] inode 
U D U D 0 U 


struct file operations Xi fop; 
D 0 D D 0 D D inode- 4 fog] 
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OO D 18006. count 0 0 0 D BB B BLU D U 
OO [] int i count; 

H atomic t i count;‏ ה ה 
OOO00000000000000000000000000000000000‏ 


םםםםםםםםפצ 
atonic read] v|] ;‏ 
atonic set] v, val ue] ;‏ 


file O 0 dentry O00‏ בםםםםםםם 
dentry OOOO‏ ]5 


0000000 על םםםםםםםםם 
void [] *d del ete] [] struct dentry *[] ;‏ 


םםםםםםה שש OOO000000‏ 

int [| *d delete[] [] struct dentry 4]: 

U U D 0 D 0 0 0 0 D D D D [በ በ በ 
O0000000000000000000 

struct dentry *d alloc root] struct inode *, struct dentry *[] ; 


O0000000000000000000 
struct dentry *d alloc root] struct inode *[] ; 


6 veso [J 


OO0000fildr DD 0 0 0 0 0 U 
typedef int [] *filldir t[] [] void *, const char *, int, off t, ino t[] ; 
U 0 D 00 filår DD 0 0 0 0 0 በ 
typedef int [] *filldir t[] [ void *, const char *, int, off t, ino t, unsigned] ; 
םםםםםםםםםםםםםםםםהם‎ fs. hp 0 
/* 




































































* File types 

*/ 
#defi ne IT UKNIN 0 
#define DI FIFO 1 
#defi ne DI GR 2 
#efine DI HR 4 
#defi ne DI HK 6 
#define DI REG 8 
#defi ne DI LN 10 
#defi ne DI SAK 12 
#defi ne IT WT 14 


TO0O0000000000000 
O0O00000000000000000000000 


struct file operations nyfs file operations = 1 
nyfs file I seek, 
generic file read, 
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generic file wite, 
NIL, 
NIL, 
nyfs ioctl, 
NIL 
E 


םםםםםםםם 
struct file operations nyfs file operations = 1‏ 
llseek: nyfs file I seek,‏ 
read: generic file read,‏ 
wite: generic file wite,‏ 
ioctl: nyfs ioctl,‏ 
bi‏ 
D 0 DD 0 DD GU CD D D D 0 D 0 DDD 1s0œ%90 D O @000000000‏ 
tut‏ 
struct foo (‏ 
int foo;‏ 
long bar;‏ 
bi‏ 


struct foo x = í bor =3 .foo 5-4k 
8] VES[] file operati ons 


D 0 0 0 0 D DDD 0 00 0 DDD D 0000 DD 0 0 0 000 U‏ 0 0 0 ה ם 
U U U U‏ 
OO [] int (*fsync) (struct file *, struct dentry +);‏ 
Qint (*fsync) (struct file *, struct dentry * int);‏ ם ם 
U D D 0 file operations [] (1 [1 D D D D‏ 
int [| "check nedi a change] [| kdev t dev] ;‏ 
int [| *revalidate[] [] kdev t dev] ;‏ 
O00000000 block device operati ons[]‏ 
struct block device operations {‏ 
int [] *open[] [] struct inode *, struct file *[[ ;‏ 
int [] *rel ease] [| struct inode *, struct file 4]:‏ 
int [] “ioct1[] [] struct inode *, struct file *, unsigned, unsigned long] ;‏ 
int [| "check nedia change] [| kdev t[] ;‏ 
int [] *revalidate] [] kdev t[] ;‏ 











bi 
D D D D 0 D D 0 inde 000000000 
[] [] [] struct block device Xi bdev; 
OOO block device] HOHOOOO0000000000 
struct block device { 
struct list head bd hash; 
atomc t bd count; 
dev t bd dev; 
atomc t bd openers; 
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const struct 
bl ock devi ce operations *bd op; 
struct senaphore bd sem 


ነ 
O D file operations] 0 0 00 DD D D D D 0 D 0 0 D D D D 0 0 000 DD 0 U 


readv)[] witevOD D | [ Ú‏ בםםםםםםםםםםםםםםםםםםםםםםםםה 
t [] *readv] [| struct file *, const struct iovec *, unsigned long, loff t “|:‏ 58126 
t  *witev]] 0 struct file *, const struct iovec *, unsigned long, loff t *[];‏ 58126 


9] VFS] inode operati ons 


file operations ] ] O inode operations ] [| [|] | inode[] OO 

inode operations [| 0 D 0 followlink] D D DD D D 0 0 0 D 0 D U 

D struct dentry * (*followlink) (struct dentry *, struct dentry *,‏ ][ ם ם 
unsi gned int);‏ 

O00 1 1:1 (*followlink) (struct dentry *, struct mmm data *( ; 

000000 0 ה בםםםםםםםםםםםםםםםםםםםםםםםם 
U U UD D 0 0 0 0 U‏ 


struct naneidata 1 
struct dentry *dentry; 
struct vfsnount *nmt; 
struct gstr last; 
unsi gned int flags; 
int last_type; 

L 

inode operations] D 000000000000 
int [] *setattr[] [| struct dentry *, struct iattr *[] ; 
int [] *getattr[] [] struct dentry *, struct iattr *[]; 
U 0 0 0 DD 00 0 0 D seettrODn 000000 $ superblock OOOO 

notify change() 0000000 500000000000 

int [] *readpage] [] struct file * struct page *[] ; 

int [] *witepage[] [ struct file *, struct page *[] ; 

int [] *updatepagel] [| struct file *, struct page *, unsigned long, unsigned int, int] ; 
int [] *bnap] [] struct inode *,int{ ; 

int [] *snap] [] struct inode *,int[] ; 


10] VES[] super operati ons 


U super operati ons [| [| D O wite inode] | | 0 D 0 B] 11 D. በ በ በ 
OOOO void (*wite inode) (struct inode +); 

OOOO void (*wite inode) (struct inode *, int); 

U DDD D DDD DDD D D DD D በበበ በበ inde UD D 00 0 0 

U D stafs) 00000000000 statfs םםםםםםםםםההה‎ 
[|] U [] זוה‎ (*statfs) (struct super block *, struct 516175 *, int); 
ם‎ U int (*statfs) (struct super block *, struct statfs +); 
OOO notify change] D D 00 getattr()[] 50 [000 
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HOU Et2I IU L 


םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהההתת 
בםםםםםםםההההאע םםםםםםם 

Dos 0 D 0 DD D D D D Max) 0 0 0 D DU Mix 0 D DD D D D D 0 D D Gnus 
Torvalds [| Linux [] 0000000 Tanenbaum] [| O O Qperati ng 55165 Desi gn And 
Inpl enent ation] ] [] [] 0 Tanenbaun] D በ |] MnixQQOO0000 D nms 0 [| ]אמא‎ 
በበበ በበበበ Dn" DD DD 00 DDD 000 DDD 0 

e 0000000000 6] 

e 0000 40000000000 

s O00000 

በ םםם ה הפצ‎ 1920 400000000 6nxJ 000000 tD DD Ú 
D0000000 0.% D 0 0 DD 0 Mx 000000 DD 28 
በበበበበበ DD DDD DDD DD 2550 D DDD DDD DD 0 D 0 0 DD DD D 00 0 
በበ D 0 0 0 0 DD 00 DD DDD D D D 0 D D D D D D D D D D 0 0 0 0 D 00 0 U 
uuu 

19930 0 ጩጩ Card] Et በ D 00 በበበ Bt B2 000000000 

« 0000000 000000000000000 BO 00000 

e I0000000000000000000000000000 25000000 

















U U 
e I000000000000000000000 ጆጻቨ 0000 U 
e [000000000000000000000000000000000000 












































U U 0 U D 0000000000000 UD bu 

- 00000 

91 0000 

Mnix Bt O0000000000000000000‏ ]662 םםםםםםםםם 
O0O0000000000000000000000000000000000000‏ 
OO00000000000——000000000 000000000000000000‏ 
OO0000000000000000000000000000000000 OOOO‏ 
O0O0000000000000000000000000000000000000‏ 
OOO000000000000000000000‏ 
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OOO00000000000000000000000000000000 
םםםםםםםםםםםם‎ box 0 0 0 0 0000 D 0 00 D 0 00 0 0 DD 
בםםםםםםםםםם‎ B20 NO 00 DD DD 0 D 0000 DDD 000000 U 
נבםםםםםםםםםםםםםםםםם‎ 2Q00000000000000000 
O0O00000000000000000000000000000000000 
00000 םםםםםםםםםםםםםםםםםםםםםםםםםםםההא‎ 
FBt200000000000000000000000000000000000000 
U U U U D U D 0 0 0 0 000000 0 DD U D 0 0 U D U 0 0 U 



























































nm 
o 
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o 
o 
o 
o 
o 
o 
o 
o 
= 
መኗ 
© 
መ 
o 
፦ 
o 
o9 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
o 
፦ 
o 
፦ 
፦ 
o9 
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DOO000000000000000000000000000000 


































































































EZ EL ETE MAME JE EG 
Lu ELE: EI EL ELE 
E EL EZE ET EST E E) 


[3] EJ ET E) 
FAE ELE 








ET EL 3 
EH ESL ELE EH Er = ELE 


ET EL ELE, ETNE EL EEE EN EI E 


U U 0 U D U 0 00000000 0000 DU U 

OOO0000000000000000000000000fi1eQ00 
D0O000000000000000000000000000000 
םםםםםםםםםםם‎ 


Co 
- 


OOO000000000000000000000000000000 
OO0O00000000000000000 200000000000 
O0O000000000000000000 
O0O0000000000000000000000000000000 
U U 0 U D 000 U 
U D D 00000 DD DD 0 OD הש‎ 000000000 

U U 0 U D 00 00000000 0 U DU D U 0 U DU 0 0 0 0 0 0 0 HHH D U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U DU 0 0 U 
OOO000000000000000000000000000000000000862 
U U U U 0 U D 000 U 
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F3 ,, E3 E3 Ed EJ E3 r3 EJ EJ r3 ₪‏ בם 
EJ EJ ₪1 E3 EJ EJ EJ EJ‏ בש Ed EJ‏ ב₪ Ld‏ 
EJ EJ ₪5 E= EJ :ፎ ር: ር‏ בש EJ‏ בש ב₪ Ld‏ 

oO 

O 

r3 

oO 

r3 

oO 

r3 

oO 

o 

r3 

oO 

o 

r3 

oO 


aa saa ers 
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Ext2 | 









































Write(fd,buffer,size) 


00000 | 





D00000 








םםםםםםםםםםםםםם 091 























DD DD 0000 U‏ 000 0 0 ה 1880 בםםםםםםםםםםםםםםםםם 
ቭጫበበበበበበበበ IM D D 0 D 000 77‏ 4890000 0000000000 
77 30000000000000000000000 םםםםםםםםםםםםהם 
U U 0000000000000000 0000 00 D D 00 0 0 0 0 D 0 80000‏ 
300400500000 3000000000000000 100000 100000 0 
00000000000000N‏ 800000000000 400400 םםםםםםםם 
U U U U U U D 0 0 U D 0 000000000 U‏ 

U U U U D 0 0 U D U 

U U UU HE > 00 0 U 









































מםםםםםהההההאא 92 


9.2.1 Bt2QO0000 


םםםםטםםםםםםטםםםםםםםםםםםםםםםםםםםהםםםםםם 
ספ 0 U UU U DU D U 0 0 D U D 0 0 U D U 0 0 0 0 0 0 0 0 0 0 0 0 U D 0 DU D‏ 
OOO000000000000000000000‏ 
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UI Linux [ ul 


e [000000000000000000000000000000000000 
በገ በ በ 0 U D 00 0000 U 
e םםםםםםםםםםםםהההאםםםםםםםםםםםםםםםםםםהםם‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U በ በ D 0 0 0 D U 00 U 
e J000000000000000000000000000000000000 
U U U በ በበበ በበበ D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U U U 
e UU UU DU00000000 0 00 UU 000 U D U 0 U D U D U DU 0 U U U 
U U U UU U 000 U 
LZ D D DDD 00 DDD DD DD 000 DDD DDD 0000 DD DD 0000 U 
000 920 Bt2000000000000000000000000000000 
OOO00000000000000000000000000000000000 
OOO000000000000000000000000000000000000 
OOO0000000000000000000000000000000000 
DOOO00000000000000000000 Bi? 0000000000 


LERNEN NNENE E 


0 92 Bt2Q00000000000 














































































9.2.2 EÆt20000 


Bt20 0000000 םםםםםםםםםםםםםםהשא‎ 200000000 
OG ext2 super block) 0 0000 incl ude/ Li nux/ ext2 fs.h0 00000000000 


U U U 

struct ext2 super block 

{ u32 s inodes count; / 
u32 s blocks count; / 
u32 sr blocks count; /*000 
u32 s free blocks comt; /*9 D D 
u32 s free 180068 count; /*000 
u32 s first data block; /፡ 
u32 slog block size; /* 000000000 


/ 


* 


5 100 frag si ze; 


s blocks per group; 
5 frags per Group; 
5 inodes per group; 


5 nti ne; 

5 Wine; 

s nnt count; 

s nax nmt count; 
S nagic; 

s state; 

S errors; 


S ninor rev level; 


s lastcheck; 

S checki nterval ; 
s rev level; 

S def resu d; 

S def resgid; 









































Ext2 [] | 
/* 0000000 * 

/* 00000 v 
/* 00000 * 

* םםםםםםםם*! 
* םםםםםםםםםםם 
” םםםםםםםםםםםםםםםםם 
* 0000 */ 
” 0000000 */ 
O000000000000 ”‏ 
^ 0000000 */ 
* 180108 1111111111 */ 

= 0000 * 
OOO0000000000000 v 
בםםםםםםםםםםםםםםםםםם*!‎ v 
/* 000 * 
/* 00000000000 =F 
ሥበበበበበበበበበበበበ” 
































* These fields are for EXI2 DYNAMC REV superbl 0015 only. 


* 








* Note: the difference between the conpatible feature set and 
* the inconpatible feature set is that if there is a bit set 
* in the inconpatible feature set that the kernel doesn't 
* know about, it should refuse to nount the filesystem 


ትች 


* e2fsck's requirenents are nore strict; if it doesn't know 
* about a feature in either the conpatible or inconpatible 
* feature set, it must abort and not try to redde wth 

* things it doesn't understand... 


u32 s 


first ino; 





ul6 5 


inode si ze; 





s block group nr; 





s feature conpat; 





s feature i nconpat ; 





s feature ro conpat; 





/* 


* Perfornance hints. 


s uui d[ 16]: 
s vol une nanef 16]; 
s last nøunt ed[ 64]; 


5 al gori thm usage bi t nap; 














ሥበበበበበበበበበበበ ” 
/* 0000000 * 

/* 00000000 v 
ሥበበበበበበበ” 

/* 00000000 v 

/* 000000000 > 

/* 128000000000 */ 
ያ# 00 * 

/* 00000000000 * 
/* 1111111126. 














* happen if the EXI2 GOMPAT PREAIIC flag is on. 


*/ 
. 8 
. 8 
. ul6 
- W2 


L 


s prealloc blocks; 


5 prealloc dir blocks; 


s padii ngl; 
s reserved[ 204] ; 


N 
U U U 


/* 0000 


U U 
[#000000 


/*Q םםםםההתא‎ 


Directory preal location should only 


*/ 


ሣ 
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O0O000000000000000000000000000000000000 


U U U U 








ש םםםםםםםםםם 














O s log block size[] [| Ú 


םםםםםםםםםםםםםםםםםםםםםםםםהםםםםםםםםםםםםם 
םםםםםםםםםםםםםםהםםםההה sr blocks count‏ בםםםםםםםםםם 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 

U U U በበ በበበ 0000000000 U 
02000000 000000000000 100 DU D Ds first data blockQ 10 


log hock size] NANOOD 2000000000000 102400000‏ 5 30 ם 
2480000000000 102400000100 במ םםםםם 
DS log frag size‏ סנ 0000 DOWN DDD D 00000 D o Et2r D D‏ 


םםםםםםםםםםםםםםםםםםםםםהה ה<>א ]4 O‏ 


#define FXI2 VNTD  Ox0001 


U U U U D U D 0 U 
































struct ext2 sb info 
t 


unsi gned long s frag size; 

unsi gned long s frags per block; 
unsi gned long s 180065 per block; 
unsigned long s frags per group; 
unsi gned long s blocks per group; 
unsi gned long s 120005 per group; 
unsi 0060 long s itb per group 
unsi gned long 5 db per group; 
unsi gned long s_desc_per_bl ock; 
unsi gned long s groups count; 
struct buffer head * 5 sbh; 
struct buffer head ** s group desc; 
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#define FXI2 FRR FS  0x0002 


s lastcheck [] D NN D D 0 0 0 D D D D D s_checkinterval 0 0 0 
U U U በ በ U D 0 0 0 D U 00 U 
םםםםםםםםםםםםםםםםם‎ seres D D U 0 0 0 0 0 0000000 U 
םםםםםםםםםםםםםםם‎ 20000000000000 
በበበበበበበበበበበበቨበበበበ V8o000000000000000000d 
00000 ext2 super info] D 0 D D D D 0 0 0 D DD םםםםםםםםםםההשא‎ 
ext2 read super0 0000000000000 םםםםםםםםםםםםםםהפט‎ 
በገ በ በ በ U UU D D 0 0 D U 0 D D U D 0 0 0 D U 0 0 0 0 0 0 0 0 U D 0 0 U D U 
በበበበበበበበ በበ በበበ 82000000000000000000 םםםםהפצ‎ 
2 0000000 ext2 super info] [000000 
በ] םםםם‎ DUDU include/1i nux/ ext2 fs sb O םםםםםםםםםםההה‎ 


























U U U 0000000000 U 


በ0100 * 
*/ 


בם 
+ 
+ 








PR £3: LJ E 
Be ES SA 
+ 
~~ 








[ Ext2 | 


unsigned short s loaded inode bi tnaps; !* *הםםםהםההםהםהםבההה‎ 
unsigned short s loaded bl ock bi tnaps; /ብ D D DDD DDD DDD xI 
unsi gned long s inode bi tnap number] Fxt 2 MX RAP LOTH: 

struct buffer head * s inode bitnap[ Et2 MX GO P LOVED ; 


unsi gned long s block bi tnap number] Fxt 2 MX RAP LONE); 


struct buffer head * s block bi tnap[ Et2 MX GO P LOTE]: 
























































int s renane I ock; /ገበበበበበበበ[” 
struct wait_queue * 8 renane wit; /O0000000000*/ 
unsigned long s nount opt; OOOO */ 
unsi gned short s resui d; /በበበበበበበ” 

1051 gned short s resgi d; *O00000000% 
unsigned short 5 nount state; AOOOOODOOOOOO 
unsi gned short 5 pad; /ጠ[በ” 

int 8 inode size; /ጠብበበበበ” 

int s first ino; *םםםםםף\!‎ 


L 
s block bitnap nunber[] [| s block bitnap] [| s inode bitnap nunber[] [] 
s inode bi tnap 10 ה‎ D DD DD DOD D 0 0 DD 000 0 0 0 0000 0 

U D D D 00 0 0 D D 00 DD DDD 0 D D 0 D 0 D D D D D D D D DD 0 0 D UD 
D 0 D 000 DDD DDD DDD በበ s grow ה‎ D d B 0 0 D D DD D DO D D 0 0 
U D D D 0 0 D DD 00 DD DDD D D D 0 D D D D D D 0 U 

0 9.30 30000000000000000000 








super block 


ext2 sb info 





EXT2 በ D 
00000 


םםםםםםםםםםםםם 093 


9.2.3 LZ 0000 


Ft20 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםהאא‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 
U U U በበ በበበ በበበ 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
םםםםםםםםהנטאםםםםםםםםםםםםםםםםםםםהם‎ ext2 inode] 
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incl ude/ Li nux/ext2 52 סםםםםםםםםהםםםםםהםםםםהםהםםםהםההםהםההה‎ 
U U U U 
struct ext2 inode + 
. ሀ161 node; /ፆገገገበበበበበበ * 
| ul6 i ud /ፆገበበበበበበበ” 
| 02. 1 size /* 000000000 ሣ 
ui 1 ating; /* 00000000000 * 
ui i ctine: /* 0000000000 ሣ 
ui i min; /* 00000000000 * 
ui 1 dine: /* 000000 v 
_—u6 i gid /ፆገበበበበበበበቨ[ * 
. ₪16 i links count /* 00000000 * 
ui 1 blocks; /* 0000000000 520000 *# 
ui i flags: /* 0000000 * 
uni on /ጠበበበበበበበበሣ 
w32 i block Fxt2 N ROSS), ፆበገገበበበበበ[በበ * 
_ u32 i version; /* 000000000 NS ሣ 
 u3 1 file ad; םםםםםםםםםםםםםם‎ * 
u2 1 dir ad *םםםםםםםםםםםםםםם‎ 
uw li frag מםםםםם*!‎ ” 
__u32 1 faddr; /*0000 * 
union *םםםםםםםףג*!‎ 
} 
U U U U 00 0 000 0 0 0 0 U D 0 0 D D 0 U D 0 (U 
U U U 0 0 0 0 00 0 UD D 0 0 U 
]ዝ  በበበጀመ ጋ DD DDD 00 DD 0000 DDD 00 DDD 00 D 000 U 





Bt2000000000000000 S000 2000000000 20 000" 00 


ገበገ]በበበ በ DU DUDUDU D" D" 0 U 
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DUD 94000‏ "םםםםם 








[ Ext2 | 









































Data 


Data 





[AF 
















Data 


םםםםםםם 


0000000 

0000000 > d Data 

0000000 ETE 
Data 


בםםםםםםםםםםםםםה 094 


םםםםםםיםםםםםיםםםםםםםםםםםםםםםםםםיםםםיםם 
םםםםיםםםםםיםםםםיםםםםםיםםםםםםםםםם 
OO0O0000062000000000 1890000 40000 2000‏ 
DDD D D D D 0 [00 12K8256KB+ 640816]‏ 0 0 0 2500 בםםםםםםםםםהם 
][ 
][ 





















200000000000000000 ቋጃ 
םםםםםםםםםםםםםםםםםהם‎ 1000000000000 
OO 2564240042 D 0 0 D D 0 D D D D 0 0 D D D D D 0 D 0 0 800000000 
OOO00000000000000 10000000000000000 10002564297 0 
פםםםםםםםםםם‎ 


000000000000 השהםםםםםםםםותה 
SECRMHL |‏ 1202 
በገበበበበገበበበበበበበበበበበበበበበበበበበበ;በበበ[በ‏ 

EXI2 UNRMFL  Ox00000002 


OOO0000000000000000000000000000 























OOO0000000000000000000000000000 


U U 
EXT2 SYNC FL 0800000008 


U U U U D U D 0 0 00 0 000 HHH D םיט‎ U D U HEB. 0 000 000 HD U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 ቨ 0 U 
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U uuu 
םםםםםםםםםםהע םםםםםםםםםםםםם‎ 
03000000000000000000000000000000000000 


[ D 0 0 ከ ከ ሀፒ በ include Li nux/ext2 fs. hD OOD 
#defi ne EXI2 BAD IND 1 


O0O00000000000000000000000 


























0196 EXI2 BOOT IND 2 
OOO0000000000000 
#efine EXI2 IIK IND 3 
ላ በበበ 00000 U 

#efine EXI2 DATA INO 4 
ALO OD 


06186 EXI2 BOOT LOALER IND5 

U U U U 000 0000 00 0 0 U 
#efine EXI2 UNEL IIR INO 6 
U U U 0 00 0 00 0 U D 0 0 D 0 [ 


עו םםםםםםםםםםםםםם 
#efine FXI2 FIRST IND 11‏ 
0000000000000000000000000000000 4 
Bt200000000000000000000000000 VSOOOOOOO‏ 0 
OOO0000000000000000000 ext2 inode info D 0 0 0 00 D D 0 U‏ 


D 0 incude/L nux ext2 fs i-h(] D U 0 0 DU‏ םםםםםםםםםםם 
struct ext2 inode info‏ 
1 


L1 









































 u3 i 15]; /ጠበበበበበበ” 
12. 1 flags; /ጠበበበበበበ” 
. 102 i faddr; /ጠብበበበሣ 
88i frag no; /ጠብጠበበበበበበበበበበበበሣ 
__u8i_frag size; /*O 00 */ 
. ₪6 i osync; /*0 0 */ 
12. ifile ad; /ጠበበበበበበበ* 
_u32 1 dir ad; /ጠበበበበበበበ” 
 u 1 dine, /ጠበበበበበበ” 
- w32 i block group, 000000000 


- 832 i next alloc bl ock: 
. ₪32 1 next alloc goal; 
| 2 i prealloc block; 
- 2 i prealloc count; 


u32 1 dir start lookup 
int i newinode:1 /* Is a freshly allocated i node */ 





L 


ቂጄ በበ በበበ በበ በበበበበበበበበበሀበበ 200000000000000 
በ] DD ext2imdeinfoQ D D D D 0 0 0 0 D DD א‎ 000000000 
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ext2 inode הפו‎ D D D 0 0 0 D D D D D 0 0 























Ext2 | 


























םםםםםםםםםםםםהםהה<אם 


DOO0000000000000000000000000000000000000 
OOO0000000000000000000 ext2 inode infoQ DUU 


9.2.4 OOOO 
U U DU 000000 DU00000000 0 0 0 DU U 0 U 0 U D DD U 0 U 














ext2 group desci 0 D 0 D 00 200000000000000000000 
struct ext2 group desc 
{ 
. u32 bg block bi t nap; 10 0 0 0000000 v 
. [ጋ bg i node bi t nap, /ማገበበበበበበበበበበ[በ[በ * 
- 8322 bg i node table; 00000000000 ሣ 
. ₪16 bg free blocks count; ההההה1*/‎ a 
. ₪16 bg free inodes count; /*000000000 V 
. ₪16 bg used dirs court; /*00000000000 ” 
. ሀ16 bg pad; /ብማገገበበበበ በ” 
. u32] 3] bg reserved; PO NILOO 12000 */ 





} 

O0O00000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
O0O00000000000000000000000000000000000 





9.2.5 HR 


U U U U D U D 0 0 0 D U 0 0 0000000 00 0 U DU 0 U D U D 0 U 
በገ [በ በ በ] D 0 0 0 D 0 0 0 0 U 00000 00 0 0 0 U 0 U D U 0 U 0 U D 0 U 
U D DDD 00 0 DDD 000000 DD GOOOOOO00000000000 
U U U U 
kt2o))0000000000000000000000000000000000 
OO 542 MX RAP HQ D D 0 D D D D D D D 0 0 0 D D DD 0000000 
םםםםםםםםםםםםםםם‎ 2000000000 Wood 
00000 et2spinftoF N00 40000000000000000 
s block bi tnap nunber[ JT D 000000000000000000000000000 
בםםםםםםםםם‎ s א‎ bitmap II0000000000000000000 

s inode bitnap mmber[][] s inode bitmap IN 000000000 
םבםםםםםםםםםםםם‎ Bt2q00000 4000000000000000 
U linu/fs/ext2/balloc.c[][]l] ם‎ U ם‎ load block tnan 10 000000000 
U U U UD U U D 0 0 0 D U 00 U 
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UI Linux [ ul 


םםםםםםםםםםםםםםםםםםםםה 
D 0 D 0 D 0 0 dd D D D D 0 0 0 0 0 U‏ ה[ block bitnap number‏ 5 0200000 
U U D BE 0 0 D 000 0 U‏ 
Bt2 MX GOP [ፈለግ] D 0 0 D D D U D D 0 DD DDD [‏ 0300000000 
s block bitnap nmber jo 00000000‏ םםםםםםםםםםםםםםםםםםהם 
በበበበበበበበበበ በበበ 0 D D D D 0 D D D D D 0 D 0 D D DD DD 0 0 O‏ 
Ü‏ |[ ה s block bitnap[][]‏ 
O400000000 82 MX GOP [ONE 1111110000‏ 
e 0000 s block bitnap number O DD D 0 D 0 0 D 0 D 0 00 0 D 00 0 0 D‏ 
B. D U 0 0 0 U LU DU D‏ ההא s block bitnap‏ בםםםםםםםםםםםםםםםהם 
D 0 0 D D 0 በ‏ השע block‏ פםםםםםםםםםםםםםםםהם 
e 00000000000 s block bitmap II0000000000000000‏ 
በበገ]በበበበበበገ D D D D D 0 D D DD 0 D D 0 D 0 0 0 D D DD 0 U‏ 
U‏ 
U‏ 

























































































U U U UU በበበ በ በበ D 0 0 0 0 0 DO 
Ext2 MX GAP LORD D D D D 0 D 0 0 0 D D D D D D 0 0 0 
OOO000000000000000 















































9.2.6 000000000 


O0O00000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
OOO00000000000000000000 
OOO00000000000000000000000000000000000 
U U U U DU U 
D fs/ext2/inode.c D D D ext2 0 00000000000000 


000000 
voi 6 ext2 read i node [] struct inode * i node] 
1 

































































struct buffer head * bh; 
struct ext2 inode * rawinode; 
unsi gned ] ong bl 00% group; 
unsi gned ] ong group desc; 
unsi gned | ong desc; 
unsi 0060 1 ong bl ock; 
unsi gned | ong offset; 

struct ext2 group desc * gdp, 


if [| O inode ב‎ ino != EDP ROT INO && i node- ב‎ ino != EXI2 AL ITK INO & 
i node- ב‎ ino | =EXT2 AQ. DATA I ND&&i node- ב‎ ino «EXI2 H RST INQ i node- ב‎ sn | | inode- ב‎ ino 
>1e32 to cpu] i node- ב‎ sb >æ ext2 sb.s es->s inodes count] [] 
{ 
ext 2 error [] inode-4 sb, "ext2 read inode", 
"bad inode number: Hu", inode- ב‎ ing]; 
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[ Ext2 | 


goto bad i node; 









































› 
block group =] 19006 ב‎ ino - 10 / EXI2 INIES PER GOA] inode 2 sb]: 
if [] block group >= inode ב‎ sb- 1 ext2 52.5 groups count] + 
ext2 error [] inode->i_sb, "ext2 read inode", 
"group >= groups count "[] ; 
goto bad i node; 
› 
group desc = block group << FXI2 DESC PER H(YK HTS] inode- ב‎ sk]; 
desc = block group &[] EXI2 IFSC PER HOK] inode Å sb] - 1]: 
bh = inode- ב‎ sb >u. ext2 sb. 5 group desc] group desc]; 
if [] !ከከ] + 
ext2 error [] inode- ב‎ sb, "ext2 read inode", 
"Descriptor not loaded"[] ; 
goto bad inode; 





} 


gdp = [] struct ext2 group desc *] bh > data; 
/* 
* Figure out the offset wthin the block group inode table 
*/ 
offset = [] D inode- ב‎ ino - 1] %EXI2 INIFS PER CRIF] inode 4 sb * 
EXT2 INTE SIZE] inode- ב‎ sb] ; 
block =1632 to cpu] gdpl desc]. bg inode table] + 
0 offset > EXI2 HOK SIZE HTS] inode- ב‎ sh]; 
if [] ![] bh = sb bread] inode-zi sb, block] [ብ በ] + 
ext2 error [] inode- ב‎ sb, "ext2 read inode", 
"unable to read inode block - " 
"inode%u, hlock=%u", inode ino, block] ; 
goto bad inode; 
› 
offset ፎፎ | EXI2 HOK SIZE] inode 4 sb] - 10; 
rawinode = [| struct 6812 inode * [| bb > data + offset] ; 


inode-3 node = 1616 to cpu] raw inode- i node] ; 
inode-> uid =] uid 1[] 1616 to cpu] rawinode 4 uid low] ; 
inode-3 gid =] gid t[] 1616 to cpu] rawinode 4 gid low]; 
iff I test opt J inode ב‎ sb MO [118፲] [0 + 
inode- ב‎ uid | =1616 to cpu] rawinode ב‎ uid high] > 16 
inode- ב‎ gid | =1616 to cpu] rawinode- ב‎ gid high] > 16 
› 
inode 2 nlink -1 616 to cpu] rawinode- ב‎ links count] ; 
inode- ב‎ size =1e32 to cpu] rawi node- ኋ size] ; 
inode-3 atine = 1632 to cpu] rawinode- ב‎ atine] ; 
inode-3 ctine = 1632 to cpu] rawi node- 4 ctine] ; 
18006- ב‎ mine = 1632 to cpu] rawinode- > ntine] : 
inode- >u. ext2 i.i 01108 =1 632 to cpu] rawi node- ב‎ dine] ; 
/ች Vé now have enough fields to check if the inode vas active or not. 
* This is needed because nfsd night try to access dead i nodes 
* the test is that sane one that e2fsck uses 
* Neil Brown 19990ct 15 
*/ 
— 355 — 









































[| | Linux | ul 


if [| inode ב‎ nlink = 0 &&] inode- ב‎ node =0 | | inode- >u ext2 i.i dtine[][] + 
/* this inode is deleted */ 
brel se [] bh] ; 
goto bad inode; 














› 
inode- ב‎ blksize = PXE SIZE — /* This is the optinal 1() 5126 [] for stat] , not 
the fs block size */ 
inode- >i blocks =1e32 to cpu] raw inode- ב‎ blocks] ; 
inode- 4 version = Hevent; 
inode- >u. ext2 i.i flags =1632 to cpu] rawi node- ב‎ flags] ; 
inode- >u. ext2 i.i faddr =1632 to cpu] raw inode- ב‎ faddr[]; 
inode- >u ext2 i.i frag no =rawinode x frag 
inode- >u ext2 i.i frag size = rawi node- > fsize; 
inode- >u. ext2 i.i file acl =1e32 to cpu] rawinode-3 file acl] ; 
if [] S ISREG] inode- > nodef] [] 
inode- >i size | + |  u64]1e32 to cpu] rawinode-3 size high] ] «32; 
el se 
inode- >u ext2 i.i dir acl =1632 to cpu] rawinode-3 dir acl[]; 
inode- > generation —1e32 to cpu] rawi node- > generation] ; 
inode- >u. ext2 i.i prealloc count = 0; 
i node- >u. ext2 i.i block group = block group; 


/* 
* NJE The in-nenory inode i data array is in little endi an order 
* even on big endi an nachi nes: ve do NT bytesvap the block nunbers! 
*/ 
for | Hock 20; block > EXI2 NH(XKS blockHf] 
i node- >u. ext2 i.i datal block] =rawinode->i_ H ock[ bl ock]; 


if J inode ב‎ ino = EXI2 AL IIX INO | | 
inode->i_ ino = EXD AQ, DATA INQ] 

/* Nothing to do */ ; 

else if [| S ISRAG] inode 4 node] [| 1 
inode-zi op = &ext2 file inode operations; 
inode- ב‎ fop = 66:12 file operations; 
inode- ב‎ napping >a ops = &ext2 aops; 

} else if [] 5 181] ቪ] inode 4 node] | + 
inode- 2 op = &ext2 dir inode operations; 
inode- ב‎ fop = &ext2 dir operations; 
inode- >i napping >a ops = &ext2 aops; 

} else if [| S ISN] inode-zi node] 0 + 
if [] !inode- ב‎ blocks] 

inode- 4 op = 66312 fast symi nk i node operati ons; 





else { 
i node- ב‎ op = Spage symlink i node operati ons; 
inode- ב‎ napping >a ops = &ext2 aops; 

} 

} else 
init special inode] inode, inode- node, 
1632 to cpu] rawinode ב‎ block 01] [] ; 

brel se [] bh] : 


inode- ב‎ attr flags =0; 
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[ Ext2 | 

if [ inode >u ext2 i.i flags SED SYNC HI + 
inode ב‎ attr flags | = ATTR FLAG SYNRNIS 
inode- ב‎ flags | 5 SYNG 









































} 
if [] inode- >u ext2 i.i flags & EXI2 APEN HI] + 
inode- ב‎ attr flags | = ATTR FLAG APPEND 
inode-> flags | 5 APPEND 
T 
if [] inode- >u ext2 i.i flags & EXI2 IMIDIAHE RI 1 
inode- ב‎ attr flags | = ATIR HAGIMMIIAH E 
inode-3 flags | = S IMMIABE; 
} 
if [] inode- גכ‎ ext2 i.i flags 6 EXI2 NONIME AY 1 
inode-3 attr flags | = ATIR FLAG NATI M; 
inode- >i flags | 5 NONIT NE 
T 


return; 

bad i node: 
nake bad i node[] inode] ; 
return; 


T 

200000000000000000000000000 םםםםםםםם 

e I0000000000000000000 ET ROT IN} EX גא‎ IIX IND 
U ET2 AL DAA LINH D D D 0 D D D 0 0 D 0 DDD D DD DD EXI2 8መጩ፲ INNO 
םםםםםםםםםםםםהםםםםםםםםםהםםהםםםםםםהתגת‎ 
e םםםםםםםםהםםההםםהםםםטםטהםםםםםםםהםםהםםהם‎ 
D Ú block group = (inode- 3 ino - 1) / Bt2 INTES PER CRIRAinode ב‎ sb)[] 
e 0UUO0OU000000000000000000000000000000000 
U U U U D 0 0 DD 0 U UD 0 U D U 0 U D 0 U D U D U D U D D U D 0 U 
[| O group desc = block group >> Ext2 DESC PER BOK ATSinode- 4 sb) [00 
U U D U D U D 0 0 D በ በበበበ በበ በ በበበ በበበ ገበ በበበ በበበበ[;[ 
0000000 200000000 100000000 2000000 
e I00000000000000"0”OO000000000000000000 
[| [1 [] [] [] [] desc = block group &(Ext2 DESC PER BLOXKi node 4 sb) - DO 
s UU group desc] ወጨጫ በ D D D 0 D 0 D D 0 D D D 0 00 D DDD 00 0 [በ 
ה‎ O ከከ = inode xi sb >u ext2 50.5 group desc[ group desc] I I ה‎ [| 0 
s group æsc JO סםםםםםםםםםםםםםהםםםםםהםםםםםםםםםהה םהה‎ 
OOO000000 gdp =(struct ext2 group desc *) bh > data] 
e JO0000000000000000000 bg inode tab 000000000 


םםםםםםםםםם 
ino - 1] %Et2 INIFS PER GOR] inode sb *‏ ב offset = [ D inode-‏ 
Fxt2 INTE SIZE] 1 node- 4 sk] /*000000000000000%0‏ 
block =1e32 to cpu] gdpl desc]. bg inode table] +‏ 
sb] [/ 00000000000%0‏ ב O offset >> 2 HAK SIZE ATS] inode‏ 








EJ 
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e DDD 1632 to cpu] D O 1e16 to cpu] D D D D GOUD D D D B. 0 D D D D D 
13861 00000 20000000000000000000000000000 
*"םםםםםםםםםםםםם‎ big ending" [] ^ little ending GO 0000 1396 [ 
“little ending” םהה‎ D D 0 D D D D 16000 0124000000000 03417] 
3200000000000000000000000 200 160000000000 
*םםםםםםםםםםםםםםם‎ littleendng DOO GUD D D 0 0 000000 
“bg ending” በበበ CUI 00 0 0 0 0 D 00 00 00 D 0000000 Et200D0 
00 little ending" OO ሀ [ 1632 to cpu] [| 1616 to cu] HL D חהםםםהההה‎ 
e I0000000000000000000 sb bread] 00000000000 
U D DD 0 0 D 0 D D DD D D e2 ፤መመይበበበበበበበበበበበ በበ DDD D DD D D 
U DD DDD DDD DD DDD DDD D D D በ D 0 0 D D raw 18008] [| O rawi node = 
(struct ext2 inode *) (bh >b data + offset) 

s 0000000 e2 inde] 0 0 በበ 00 השעו הפצ‎ 0000000 
םםםםםםםם‎ MS (N0000 0000000000000000000 
በ] በ inode[] | | | mio I 0000000000000000000 E«2[ 0 
הוושו בםםםםםםםםם‎ 000000000000000000 

U 
U 
U 




















EVE E PA e TH me ELE) 

















D [በ ext2 inode info‏ םםםםםםםםםםםםםםםםםםםםםםםםםהם 
በበ ፀበበበበበበበበበበበበበ 2550 DD DD DD 0 D 0 0 D 00 000 0‏ 
በበበ D D በበ 6000000000000000 inode a *0 0000 62‏ 
U DD 0 U‏ 
e I0000000000000000 1806ሀቨ OOO inode operati ons [] 0 D] O‏ 
םםםםםבפצ 000000000000 0 file operations ] D 0 00 0 D‏ [ 
e 00 24000000000000 9000000000000000000‏ 
OOOOOOOO‏ 
s 0000000 ine JO 00 mde JOOOOO0000000000SI1SRG| []‏ 
בםםםםםםםםםםםםםםםםהםםהםהםהאז םםםםהםהת 1 םםם 
J D 0 ext2 dir inode operati ons‏ ב i መሀ i‏ 00000000000 השא U‏ 
D D mp D D 0 0 U‏ הפו הס ג 000000 ה U ext2 dir operati ons[] በ በ‏ 
OOO a ጩ[ L1 (1 D D address apace operation] O0 0000000000000‏ 
00000000000 סו U 0 D D D D 0 00 DDD init special‏ 

OOOOO000000000000000000000000 000000000 
በገ]በበ]በበበበበበበበበበበ በበ በበበበበበበበሀበበበበበበበበ[በ[በ[በ[በበ;[ 
בר ההםםםםהםםםםםםםםםםםםםםםםםםםםםםםם‎ 0 
םםםםםםםםהםםםההםםםהםםםהההםםהםהםםהםםםםם‎ 














E 





U U 
U U 
U U 
U U 
U U 
U U 
U U 


ET ELEL [FO UN EET 




















L1 


















































E El 














927 Extt2Q 000000000 


O0O00000000000000000000000000000000000 
םםםםםםם‎ ex2 drentryQ DD D Ú 
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Ext2 | 









































200000 


0 Bt20000000000000000 e2 dr entryf D 00000000 
OO000000000000000000000000000000000000000 
םםםםםםםםםם‎ 250000000000000000000 20000000 
םםםםםםםםם‎ 400000000000 NONONG D D DD D 0 D 0 DD 0 0 
|1[1[0]1] 1 1 1 | ext2 dr entry) [ ה‎ [] [| include Li nux/ext2 fs. HIO B. 1 [| D 

/* 

* Structure of a directory entry 
*/ 
#lefi ne EXI2 NAME LEN 255 

struct ext2 dir entry 1 


. ₪2 inode; /* Inode nunber */ 

. ul6 rec len /* Drectory entry length */ 
. ul6  nane len; / * Nane length */ 

char nane[ EXT2 NAME LEN; /* File nane */ 


L 


በበበበበ በ በ በበበበ ext2 םםםםםםםםםםהםהת‎ 
/* 
* The new version of the directory entry. Since EXI2 structures are 
* stored in intel byte order, and the nane len field coul d never be 
* bigger than 255 chars, it's safe to reclaimthe extra byte for the 
* file type field. 
*/ 
struct ext2 dir entry 2 1 


__u32 inode; /* Inode nunber */ 

. ul6 rec len /* Directory entry length */ 
| ₪8 nmw len; / * Nine length */ 
> ₪8 file type; 

char nane[ EXT2 NAME LEN; /* File nane */ 


L 

በበ DD D 00 DDD DD D D ext2 dir entry 20000000 
ext2 dir entry[] ] nane len] [000000000000 80000000000 
U U U 0 DDD 000 በ 0 U በበበ በበ በዐ 


* 542 directory file types. ly the 10ህ 3 bits are used The 
* other bits are reserved for now 
#[ 














enum { 
EXI2 FT UNNW /*1] [ */ 
₪72 FT ÆG HIE /*[] D D Ú */ 
EXI2 FT OR /ማሚ11 D D */ 
EXI2 FT GREY, [XD D D DDD X 
EXT2 FT H KIEV, /*00000* 
₪72 FT H FQ [XD D D DDD v 
EXI2 FT SOK /*00000* 
KD FT SIMIN /OOOOO* 
EXI2 FT MX *אםםםםםםםהםם‎ 
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L 
םםםםםםםםהםםםםת‎ 


D D D ind [0000‏ הו םםםםםםםםםםםםםםםםםםםםםםם 
D D 0 0 0 0 0 DD DD 0 D 000 20000000‏ הת 1 םםםםםםםםם 
U U U በ በበበ በበበ D U 0 0 0000000 DU 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
U U U በ በ U D 0 0 U D 0 000000 U‏ 








U U 0 U D U 0 00000000 0 DU U D U 0 U DU 0 0 0 00 0 0 0 0 0 U U U 
OOO0000000000000000 trucete0nD n n DB a D B 

0200000 

Ft20000000000000D0000000000000 ext2 dir entry 2 
በገ] በ በ U D 0 0 0 0 U 00000 000 U U 0 0 U D U D 0 0 0 D 000 000 U 
[ ext2 dir entry 2000000 rec len DDD 00000 DD DD 0000 U 
םםםםםםםםםםהההפפשםםםםםםםםםםםםםםםםםםםםםםם‎ 
OOO0000000000000000 ex2 dir entry 20 inode OO 00 D D D DD 
םםםםםםם‎ rec lenp 00000 0 U 

032000 
OO0O000000000 60000000000000000i back[QOOOO 
10 40000000000000000000000000000 60000000 
U U U U U U D 0 U 

O4000000000000 
O0O00000000000000000000000000000 


ዌ10[0: 


U U 0 U D U 0 00000000 0 U D U D U 0 U DU 0 D U 0 0 D U D 0 0 U U U 
U U U በ በበበ በበበ በበ በ በበበ 
O0O00000000000000000000000000000000000 
OOO000000000000000000000000000000000000 



























































o 


ሀ /hone/user1/fil eln hone] user 1] 00000 filel0000000‏ ם H H‏ ם 
በገ]][በ[በ በበበ በበ በበበ በበበ DDD 000 DDD DD 00 DO 000 D 000 U‏ 
OOO0000000000000000000000000 VSOOOOOOOOOO‏ 
om D 0 0 D 0 DD DD D D D 0 D hom 0 0 0 U Ú‏ םםםםםםםםםםםםםםהם 
hone] D D D D DD D vert JO0000000000000000000 fil‏ ם 
בםםםםםםםה הגש םםםםםםםםםםהםההצום 000000 
OOOOOOOOO000000"."0".."OOOOOOO0000000000‏ 
בםםםםםםםםםםההההםםהםהםםהםםםםם 

0000000000 5/4176 ם‎ | ext2 find entry 11111 1 1 1 D 
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Ul Ext2 [ 


በበ1]በበበበበበበገበበ]በበገበበበበበ[0 

/* 
ቾ ext2 find entry] [] 
* 
* finds an entry in the specified directory wth the wanted nane. It 
* returns the page in which the entry was found, and the entry itself 
* [] as a parameter - res dir[]. Page is returned napped and unl ocked. 
* Entry is guaranteed to be valid. 
*/ 

typedef struct ext2 dir entry 2 ext2 dirent[] 

struct ext2 dir entry 2 * ext2 find entry [] struct inode * dir, 

struct dentry *dentry, struct page ** res page] 






































1 
const char *nane = dentry- < nane. nane; 00000 
int nanel en = dentry- >d nane. en; በ ገበበበበበበ” 
unsi 0060 reclen = EXI2 TIR REC LEN] nanel en] ; *םםםםםנ*ם‎ 
unsigned long start, n; 
unsigned long npages = dir pages] dir] ; 0*000000000000 


אםםםםםםםם 
struct page *page = NIL;‏ 
ext2 dirent * de; lU *del] D D D 0 2000‏ 
HSG‏ 
ŒFSET CAGE */‏ */ 
*res page = NII;‏ 
start = dir--u 6812 i.i dir start lookup; [”]0000000000ሣ‏ 
if [] start >= npages[]‏ 





start = 0; 
n = start 
do 1 
char *kaddr; 
page = ext2 get page] dir, mn]; 0*9000000000000 
00000070 
if [] IIS FRR] page] O + 
kaddr = page address[] pagel] ; O “00 pgen [10000 
000070 
de =[] ext2 dret *] kaddr; Q*OOOOOOOOO 
በበበ በ” 
kaddr += PACE OCE SIZE - reclen; [] * PAGE AOE SIZE 
በበበበ10በበበበበበበበበበበበበበበበበበበበበበ000” 
while [] ך‎ char ך*‎ de <kaddf] + D >D 000000 
U D 000000 >x 











if [] ext2 natch [] 08:08] en, nane, def] [] 
goto found; 
de = ext2 next entry] def] ; 
} 
ext2 put pagel] pagel] ; /ማገበበበበበበበበማ 
} 
if [D Hn >= npages[] 
n=0 
} while [| n !=start[] ; 
return NII; 
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found: 
*res_page = page; 
dir->Lext2 i.i dir start lookup = n; 
return de; 


} 
በገ U D በ 1 .0 0 0 0 0 U D 0 0 0 0 00 U 


םםםםםםםםםה 93 


Dm J0000000000000000000000000000000000 
U U 0 D U Dms J0000000000000000000000000000000 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 00 U D 0 U 

Dm J0000000000000000000000000000000000 
DOO00000000000000000000000000000000000000 
OOO0000000000000000 vrs JOOO0000000000000 bn 
0 adùn DD 0000000000000000 
00000000 30000000000000"r D" w 0" x OOOO000 
000 3000000000000000000000000000000000000 
OOO000000000000000 


0000-1000 בםםםםםםםםםםםםםםםםםם‎ 
/ $ ls -1  /hone/user1/filel 
-IWI--r-- 1 userl usrs 490 JUN 28 0 ፻1161 


O00000000000001Q000000000000000000 1000 
00000000" -”O0000000000000 90000 30000000000 
OO0000000000000000000000000000000000 3000 
DO00000000000000000000000000000000000" -" U 
בםםםםםםםםםם‎ user D 0 DDD DD DD 0000 DDD D D 0 D 00 D ueri 
U U wrs[JO00000000000000000000000000000 
*יםםםםםםםםםםםםםםםםםםם‎ በበበበ “x םםםםםםםםםם‎ 
OO00000000000000P0|Q000040000000000000000 
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e real user ID 0000000 

e real group ID 00000000 
e effective user ID 0000000 
e effective group ID |[1[]11 [| 1 [] 


UM QOOO00000000000000‏ םבםםםםםםםםםםםםםםםםם 
OO GØMOOO000000000000000000000000000000000‏ 
DDD DDD 00000 DD DD U‏ הש OOO000000000000 setud00‏ 
000000000 ה ההאשאפםםםםםםםםהםםםםםםםםםםםםהם 
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U uuu 
U U 0 00 U 
U U U U 
U uuu 
/ 


U U U 


< 
₪ 
= 











[] “ root” [] 


U U 


U U 0 U 0 U 


ES T en TH ET 


U U 








[] 
[] 
[] 
U U 





U U D U 0 U 000 0000 0 D 0 0 0 0 DU U D D 0 0 U 0 D 0 0 D 0 0 U 
--IOOO000000000000000000000000000000 
OOOO stud] D 0 0 0 0 DD D D 0 D 0 rot 00 DDD DD DD 0000 U 
גאפ‎ dD D DD DD DD 00 D DDD 000 DD DD D D 0 D הש‎ 0000 U 


OO0O0000000000000000000 stgdQ000000000000000 


COUDE‏ "יםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 





U U 





000000 
[] unask[] [] 


D UU 











U U 0 00 U 


OO0O0O000000000000000000000000000000000 


U U U 
U U U 
םבםםםםםםםםםםםם‎ 100 DD DD 000 DD DD DD 0 םםםםםםש‎ 
UD 
wask) D 0 0 DD D DDD 300000000000 0220 0000100100 0 00000 

U U U 








[ Ext2 | 


በበ "ግ 000000000000“ s”000o00 stud] በቨ ቨ[ በ [ [ 
O“s” 00000 1 
በገ U D U D 0 0 0 D 0 0 0000 0 በበ 0 0 0 UD 0 U DU 0 U D U 









































bi y passvd[] 000000 stud] D D HU] D D /ቨ፤ n passvd NO OO D በ D /etc 


OO הפפ‎ NO DD 00 DD D D 0 D DDD DD DD 000 DD D DUU 


EEE 


BHOOOOOOOOO‏ םםםםםםםםםםםםםםםםםםםםםם 























H nD פאהשא/םםהה‎ D DD D 0 0 D D 0 D D 0 0 D D 0 D D D 0 D 0 0 0 በ 


ee ae 


OOO000000000000000000" rw------ םםםםםםםםםםםםם"‎ 
፳0000000000000000000000000000 חפ‎ D D D 0 00 [[] 
00“ 
0 pe 0000000000006000000000 ke 0000 


rwr-----"0000000000 ken) 0000000 setgidg 000 D 


U DD DD םםם‎ setg dD DO setu dD O00 ₪ מםםםםםםם ה‎ 


dep TRQOOOOOO‏ םםםםםםםםםםםםםםםםםםםםםם 
O0O0000000000000000000000000000000‏ 
U U U‏ 
U U U U D U 0 0 000000000 0 U በሀበ 98‏ 
90000000 00000000000000000000000 











000000000000000000000 הפצ‎ fs struct [] [] 
פםםםםםםםםםםםםםםם‎ 
הא םםםםםםםםםם‎ D 0 0 0 0 DD D D D D 0 0 00000 DUU 














₪ 900000000 30000000000 םםםםםםםםםםם 
setuid] setgid‏ ף ה ה ה ה 755/hone/userl/filel 0000000000 wr-x-xO‏ 
DD በ በ 200 setaid[ O‏ םהה ብበ stud]‏ 4000000000 00000000 











םטיםםםםםםםםםםםםםםת 


LZ D 00000 םםםםםםםםםםםםםםםםםםםםםםםהה הו‎ 
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900 800000000000000 00 160000000 םםםםםםםםםםםם 
setgid] setu d] 0120 150000000000‏ 01001100 םםםםםםםםםםם 
OO000 91000‏ 






























































[ 9.1 inde 100000 

U U U 0 U OO 
1100 S IFSOK 000 
1010 S IFLK 000000 
1000 5 IFREG 0000 

SES 0110 S IFHK 00000 

0100 S IHIR U U 
0010 S IFOR 000000 
0001 S IFIFO 0000 

11 S ISUD 00 

10 S ISAD 000 

9 S ISVIX U U 0 0000 0 

ዐ-8 TUK- ፲ሃጁ- TWK םםםםםםם‎ 








U D D DD 0 00 DD 00 include/ Li nux/stat.hO 0 0 D D 


34 0000 


በበበበበበበበበበበበቨበበበበበበበበበበበ መጆመሪበቨበበበበበበ[በበ[;ቨ 
U UU U 0 0 0 U D 0 D U 0 U D 0 00 0 0 0 00 0 0 0 0 0 0 0 U D 0 D U DU uuu 
U U U U U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U D U 0 0 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U D U 0 U D 0 0 0 U 


000000000 10000000000000000000000 
In /hong/userl/filel / hone/ user 2 


םםםםםםםםםםה הג file] 000 filer J [ fil]‏ םם םםםםם 
በበ file O00000000000000000000000000000‏ 
i links cout D | 10i links count D D D D D D D 0 D 00 D D D D 0 0 0 0 0‏ 

በገ] U D U 0 U 0 U D uu 

በበበ በ DD DD 000 DDD i links count JO 1000 i links count [] [] 
U) D DD 0 DD DDD 0 D NDN DDD DD 00 0 0 D D በበ [ i links ዕጩ 
በ OG00000000000000000000000000000000000000 
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Ext2 [ 






































































































































OO0000000000000000000000000000000000001s 


OOO00000000000000000000000000000000000 

















O0O00000000000000000000000000000000000000 
Bt2 [| [1 1 በ D 0 በ ex2readink)[] ext2 followlink | ה‎ D 000 
fs/ext2/symhink c 0 OOOO 





struct inode operations ext2 fast synhink inode operations = + 
read] i nk: ext2 read ink, 
fol I ow 1 i nk: ext2 follow link, 





L 
ext2 readlink()[] 0000000 
static int ext2 readlink] struct dentry *dentry, char “buffer, int bufl en] 
{ 
char *s = [] char *[] dentry- >d inode- >u. ext2 i.i data; 
return vfs readink] dentry, buffer, buflen, al: 
} 


Bt2Q000000000000 ex2 inode info] 000 inode‏ םםםםםםם 


OOO ህጩበበ[በ הג‎ 0 0 0 DDD DD בסםםםםםםםםםםםם>‎ 
vfs readink] [] 0000 fs/nanei . ር [] [] 


int vfs readlink] struct dentry *dentry, char “buffer, int buflen, const char *link] 
{ 
int len; 


len = PIR ERR] link] : 
if [ IS ERR] link] D 
goto out; 


len =strl en] link] : 
if [] len >] unsigned] buflen] 
len = bufl en; 
if [] copy to user] buffer, link, len] [] 
len =-FFAUT; 
out: 
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return ] en; 


} 
በበ] በ D U D UU 0 0 0 0 0 0 00 0 D 0 0 D U D 0 0 U D 0 0 0 D U 0 0 0 0 0 U 
U U 0 U D 0000 U 


ext2 followlink] 0 D DD 0 DD 0 D d ü D 0 DDD DDD 0 D 00 D D 
static int ext2 followlink] struct dentry *dentry, struct nanei data *nd] 
t 

char *s = [] char *[] dentry->d inode- >u ext2 i.i data; 

return vfs followlink nd, sg; 


} 

00000 ext2 readink 0O 00000000000 et2 reading OOO 
vfs reading 00000000000000 בםםםםםםםםהשא‎ VS00000 
OO00000000000000000000000000000000000 הפ‎ 
OOOO vfs followlink] ה‎ D D D D D D D 0 0000 link path va 10 D D D D Ú 


00000 dent nD DDD 0 D 0 D D 0 0 
static inline int vfs followlink] struct 06081 data *nd const char “link] 
{ 


int res =O; 

char *nane; 

if DIS ERA] link] 0 
goto fail; 


if [] Hink ='/'በ + 
path rel ease[] nd] ; 
if D ! valk init root[] link, nd] [] 
/* wird eml prefix] | stuff didit */ 
goto out; 


› 
res =link path vwal k link, nd]; 
out: 
if [] current-Aink count || res || nd Aast type! HAST NORNI 
return res; 
/* 
* If it is an iterative symlinks resol uti on in open nanmi[] ve 
* have to copy the last conponent. And all that crap because of 
* bloody create[] |] on broken synhinks. Furrfu... 
*/ 
nane =  getnane|] [| ; 
if [| ! nang[] 
return - ENMM 
strcpy[] nane, nd-> ast. nanel] ; 
nd 2 ast. nang = nane; 
return 0; 
fail: 
path rel ease] nd] ; 
return PIR FRA] link] ; 
} 
QO nanei data [] [] O ח‎ 
struct nanei data 1 
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struct dentry *dentry; 
struct vfsnount *nmt; 
struct gstr last; 
unsi gned int flags; 
int last_type; 
L 
last הא‎ 00000000 fs.h[] [| 
/* 
* Type of the last conponent on LOCKLP. PARENT 
*/ 
enum {LAST NM LAST ROT, LAST DO, LAST 00102 LAST HN}; 
በገ] በበቨ በበበገበበበበበበበበገበበበበበበበበበገበበበበበ[በ[ 
בםםםםםםםםםםםםםםםםםםהם‎ TÆT NONIOOOOOOOOOO .DO 


000 LAST DOM] 
Gir I I000000000000000000000000000 include 
li nux/ dcache. h0 [] 


* "quick string" -- eases paraneter passing, but nore 1 nportantly 
* saves "netadata" about the string [] ie length and the hash] . 
*/ 


struct qstr + 
const unsigned char * nane; 
unsi gned int len; 
unsi gned int hash; 


B 

በ] በ] በ በ vfs followlink] DD 0 0 D D D DD D DI 

e בםםםםםםםםםםםםים יםםםםםםםםםםהםה‎ vakinit root[] [| 
םםםםםםםםם‎ 

e DO linkpthwikG D DD DD DD 0 D DDD 0 DD 0 0 D 0 0 U 
link path val K O0 [| B 00000 00 [| B D [| D OOO Umanei data] [1 D] D] [] D dentry 
0000000 ወመሣበሀበበበመጩመበበበበበበበበበበበበበበበ[በበበበበበበበ 
በበ last האש‎ 0 0 D 00 D 0 0 0 0 0000 0 D D 00 str 00O last ü 000 
U 0 D D D 0 D DDD D 0 0 D 0 D 0 D D ₪ data 0 00000000000000 

e vfs followlink] D D D D D D | ink path vel KD 00000000 





95 0000 


OOO000000000006200000000000000000000000 
O0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
OO Bt2000000000000000000000000000000000000 
OO000000620000000000000000000000000000000 
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95.1 00000 


U U U U D U D 0 0 0 D 0 0 0 0000 00 0 0 U DU 0 0 0 000 0 00 0 U UD 
U U U U D U D 0 0 0 0 U 00000000 U DU 0 U D U U U U 

םםםםםםםםםםםםםםםםםםםםם: םםםםםםםם 

- 0000 f£000000000000f00000000000 

e J0000000000000000 


םםםםםםםם 
U U U U‏ 
U U U U‏ 


U U U U 
U U U U 
חש םםם.‎ 
111] 























U UU D uu 
םםםםםםםם‎ 











םםםםםםםם 











U U 
U U 


םםםםםםםם 


םםםםםםםםםםםםםהשאםםם 


םםםםםםםם 
םםםםםםםם 





I I [0 Bo‏ ה i‏ םםםםםםם 
BIG S [J‏ 


א OO‏ 
םםםםםםםם 


בםםםםםםם 














U U 























U U U U D U D 0 U 
U uu 
U U U U D U D 0; 
U U U U D U D 0; 
N ፻፪(፲3:551] 
U DDD 100 
U U U U D U D 0 U 
U U 

















U U 


L1 
L1 














U U 0 U D 00 00000000 000 U DU 0 U ul 
U U 0 U D 00 00000000 000 U DU 0 U D U 
U U 0 U 0 U 00000 00 0 UU U 


OO En םםםםםםםםםםם:םםםםםםםםםםםםםםםםםהםהםה‎ 
f)0000000000000000 

U D D D D 0 48000 foo 409% D 0 D D D D D D D 000 10 
በ MOD £00000 496000 81900000000000 


OO000000000000000000 200000000000000000 


[] 

U U 0 U D U 0 00000 U 
U U D U D 0000000 U 
U uuu 

U U 0 U D 0000000 U 
0 9400000000000 
0 150000 40000000 


ጩ OA‏ בם O‏ בם 








OOO00 2000000000000000 


e 00 2000000000000000000000000000000000 
םםםםםםםםםם‎ 120 #441900 bo 
0 4000000000 
0000000000000000000 
00 13000000000000000000000000000000000 
00000000M0000000000000000000000 
UD 84420 (8984 410 


40 םםםםםםםםםםםםםם 
U U 0 U 0 U 0000000 0 UU U‏ 


e 101008 140000 DD DD 000 DD DDD 00000 DD DD 0000 U 
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0000000000(8D «44-420 (ሀቁ 24044 4110 
םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 2900000000 
וםםםםםםםםםםםםםםםםםםםםהם‎ dock DD DD 00 0 D DD 00 0 0 U 
OO000000000000000 204000000000000000000000 
U U U 0 በ 0 UU 0 0 0 0 UU 0 D U 0 D 0 0 U 0 D 0 0 0 0 U 0 በበ 0 0 0 0 U 0 0 0 U 
בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 0 
DO00000000000000092000000000000000000000 
םםםםםםםםםםםהםםםהםם‎ 1024000000000000000 268) 000 
השש םםםםםםםםםםםםםםהם‎ 000000000000000000 1380 


































































































268881 00000 6 םםםםהםםםהםםםםםהההה‎ 80000028 32 
0000000 B20000000000000 
[ 92 0000000000000 
U D U OO U au U D 0 D U au 
1024 12 KB 268 KB 63.55 MB 2GB 
2048 24 KB 1.02 NB 513. 02 MB 2GB 
4096 48 KB 4 04 NB 2@ በ 
9.5.2 [IL Lll 


םםםםםםםםםםםםםםםםםםםםםטםם םםםםםםםםםםםםם 


በ םםםםםםםםםםהםםםםםםההאא‎ ዉወጩቨበበበበበበ[በ[በበበበበበበበ;[ 
$ echo -n "X' | dd of+tnp/hol e bs-1024 seek=6 


U D D פמ‎ ₪6 [ 61450000 6144N ዝዝ 0000 XD 0 UD D D 0 000 DU 
םםםםםםםםםםם‎ 
U U U U D U D 0 0 0 D 0 0 0 0000 00 00 U D U 0 0 0 000 0 00 0 U UD 
U U 0 U D 0000000000000 U 
מםםם‎ Ba 0000000000000000000000000000000 
OO0O0000000000000000i siz2eJ)O000000000000000 
U i boks [DPNOO0000000000000 20000000 

OOO ddOOOOOOOOO/tawkbdegOOOOOOOOO 406p Et20000 
םםםםםםםםםהם‎ i size000000 61490 i_blocksQQOOO000 8000 40% 
00000080 520000 Mi הא‎ DDD 20000000000000 100 
U U 0 U D 00000000 D U D 00 U D 000 U 


























95.3 0000000 


U U U U U 000000 DD 0 DU 0 2 0 IU 0000 DD 0 0 U 
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U U 
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ext2 get Hoch םםםםםםםםםםםםם "םםםםםיםםםםםםםםםהםםה(‎ 





00000 92 alloc bock OOD Bt20000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםההשאםםםםםהםםםםם‎ 
םםםםםםםםםםםםםםםםםםםםםםםהההשאםםהםםםםםםםם‎ 
U U 0 U D 00 0000000000000 0 0 00 U 
FBt2000000000000000000000000000000000000 




















8000000ext2 inode info] D [ i prealloc count 000000000000 
םםםםםםםםםם‎ i 16 ןא‎ 0 0 DDD DD D D 000 DDD DD D U 
በበ D U 0 0000000000000 0 0 0 D U D U D U D U በበ 000 U 
OOO0000000000000000000000000 




















DU DD DDD DU ext2 get block 10 [በ1 [1 1 D 0 fs/ est 21 node. c [] [1 
/* 
* Alocation strategy is sinple: if we have to allocate sonething, ve wll 
* have to go the whole vay to leaf. So let's do it before attaching anything 
* to tree, set linkage betwen the newborn blocks, wite themif sync is 
* required, recheck the path, free and repeat if check fails, otherwse 
* set the last mssing link [] that wll protect us fromany truncate generated 
* renovals - all blocks on the path are inmune now] and possibly force the 
* write on the parent block. 
* That has a nice additional property: no special recovery fromthe failed 
* allocations is needed - ve sinply release blocks and do not touch anything 
* reachable fromi node. 
" 
static int ext2 get block struct inode Xi node, long ibl ock, struct buffer head *bh result, 


int create[] 


1 
int err =-HQ 
int offsets[4]; 
Indirect chain 4]; 
Indirect *partial; 
unsi gned | ong goal ; 
int left; 
int depth = ext2 block to path] inode, iblock, offsets] ; 
if [ depth = 0] 
goto out; 


lock kernel] [D ; 
reread: 
partial =ext2 get branch] inode, depth, offsets, chain, éerr] ; 


/* Sinplest case - block found, no allocation needed */ 
if በ !partialg í 
got it: 

bh result-> dev = i node- > dev; 
bh result-> bl ocknr =1e32 to cpu] chai nf depth- 1]. key] ; 
bh result-> state |=] 111. >> BH Mpped ] ; 
/* dean up and exit */ 
partial =chain+depth 1; /* the whole chain */ 
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goto cl eanup; 
T 


/* Next sinple case - plain lookup or failed read of indirect block */ 
if [] !create || err =-HQ] 1 


cl eanup: 
wile [| partial >chain] í 
brel se] parti al - hl] ; 
parti al --: 
› 
unl ock kernel] [D ; 
out: 
return err; 
› 
/* 
* Indirect block might be renoved ከሃ truncate while ve wre 
* reading it. Handling of that case [] forget what we've got and 
* reread] is taken out of the nain path 
*/ 
if Derr = - FAGAN] 
goto changed; 
if [] ext2 find goal] inode, iblock, chain partial, &goal[] <Q 
goto changed; 


left =] chain + depth] - partial; 
err =ext2 alloc branch] inode, left, goal, 
offsets+] partial- chain] , partial] ; 
if Q err[] 
goto cl eanup, 


if [] ext2 splice branch] inode, iblock, chain, partial, left] <0] 
goto changed, 


bh result->b state |=] 111. > BHNw) ; 
goto got it, 


changed: 
wile [| partial > chain] 1 
brel sef] parti al - bh] ; 
parti al --; 
} 
goto reread; 
} 
በ በበ በ 000 DD በ D በ በበበ በ D D D በ በ 0 רהה‎ 0 00 0 U 
00000 inode 00000 inode 00000 ibock 000000000000 
bh result D D D D D D D 0 D D D D] buffer ה‎ 0000000000000 create 


U U U UU UD 0 U 
00 התש‎ 000 DD D D D D 0 0 0 


- 371 - 





U U 


chai nf depth 1]. key] [1 0 


በ 9] 


typedef struct + 
u32 *p 
u32 key; 
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struct buffer head *bh; 


y Indi rect 


OOO chain 400 40000000000000000000000000000 
DOO0000000000000000000000000000 በገበበበ[በ[[በቨ 
Indirect D D 0 p DD DD DD 0 D D 0 80000 
inode- ጧ ext2 i.i datal 800 bev DDD DD 0 0 0 DD D 0 0 0 D D 0 D DD D 0 0 
O000000000000000000000060 NO000000000000 
OOO000000 2000000000000000 chan Olg chain 110 D D 
DU D D 0 D אצ‎ D 00 D OO N0000000000000000 
POO D inode- > ext2 1.1 dat al 1210 0000000000 ker DD 00 D 0 0 U 
DU D D 0 D D 0 chai n 110 D 0 D hD 0 D D 00 D 0 DD D 00 D 000 D0 D 0 0 
םםםםםםםםםםםםםםםםםםם‎ p0000000000 8000 bev D DD U 


0000 chino n 


UH D TL DD םיט‎ U 


U U 0 U D 0000 U 


U U U 00 U 


U DD DD 000 DDD DDD D chid OOO 1000 chain 
OO chain] depth IN NN 0 0 0 DD D D D 0 0 0000 0 DU 


chan] I Ü D‏ בםםםםםםםםםםם 





























e ext2 get branch] 
0000000000 
0000000000 





U U U U D U 0 U D U 


U U U U D U 0 U D U 





U U U U DU U 
































U uuu 
U U U U DU U 


0000 err U 


U uuu 


e 00000 ext2 get branch] 000000 00 D 00 D 00 D D D D 0 000 U 


e [000000000000000000000000000000000000 











000000 ext2 block to path] II D D D D D 0 0 U 


000 እ[[0000000000 


DU D 0 D D 0 D D D D 000 ከ result D 00000000 


i next alloc goal DD ה‎ D DD D D D 0 0 0 D 





























depth] D 0 chai a 10 D 0 D D 0 D 0 0 0 





ext2 get bok] 00000 DDD DD D‏ בםםםםםםםםםםםםםם 
e OOOO 92 block to pati] 0 D D D D 0 0 0 D D D D D 0 ibok[ 0 D] D D‏ 
U‏ 0000000 םםםםםםםםםםםםוםםםםםםםםםםםםםםםםםם 
በገ] U D U D 0 0 0 D 0 0 00000000 0 0 D U D U D U D U 0 0 0 U 00 U‏ 


000000 ext2 get branch] 0 0 D] D] 














[] 
U U 0 U D 0 000000000 U 
0 
U U U U 0 U D U 


[ 











በገ በበበ በበበ በሀበ በበ በቧ[በቨ[ 
םםםםםםםםםםם‎ 


DDD ext2 inode info[]‏ ם םםם םםםםם 


U U 0 U D U 0 0000 0000 DU 0 U U U 
በገ U D U 0 00000000 00 0 U U U 





















































[ Ext2 | 


O0O000000000000000000000000" 0000 Y 
ext2 find goal] [HDD UD 









































e JDO00000000000000000000000000000000000 


ext2 alloc branch] D D D D D 0 0 DD D D D D 0 0 D 00 DD D D 000 0 U 


e [| ext2 alloc_brancH] NN 000000000000000000000000 
DO0O0000000000000000000000000000000000000 
OOO םנה התש‎ key DD 0000000000000000000000"0 
O OO0O000000000000000000 1node D D D D D D 0000 D D D U 


000000 ex2 splice branch] [10 B EH DU 


got it OOOO00000000000000‏ םםםםםםםםםםםםםםם 


bh result D D D D D 0 0 0 D D D D D 0 0 D 00 D 0 0 U 


U U U 
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JOS ull 


U D D D D EN D D D 0 ;በ 0 D በ 0 Mndithic Kernel D D D D D D 0 0 i 
OO000000000000000000000000000005S00000000 
OOO0000000000000000000000000000000000000 
OOO00000000000 
O0O000000000000000000000000000000000000 
OOO000000000000000000000000000000 NR800 SS [| 
000 בםםםםםםםםםםםםםםםםהה*‎ NR80000000000000 





























Enx[ בםםםםםםםםםםםםםםםםםםםםםםםםהםהה‎ Lim | 000 
םםם-- םםםםםם‎ D [ D loadable Mdu es] D D 0 0 DD D D 0 D 0 0 0 0 0 0 U 
U U UU D 0 0 U D U 0 0 0 0 0 0 0 0 U D DU 0 0 0 0 0 D U D 0 0 0 D U 0 0 0 0 DU 
































101 OQ 


10 1.1 OOOOO 


U D D D 0 0 D 0 D 0 0 0 D DD DD D 0 D 0 D 0 D D D D D D D D D D 0 0 D 0 U 
U D DD 0 0 D DD 00 DD DD D D D D D 0 D D D D D 0 D 0 D 0 D 0 0 D 00 0 0 U 
םםםםםםםםםםםםםםםםם‎ ጩመጩበ[በበበበ0በ00 הש‎ 00000000 
בםםםםםםםםםהםהההנשא)םםםםםםםםםםםםםםםםםםםםםם‎ 
DH mD םםםםםםםהםהםהםהםהה‎ 
e T U :ה ה‎ mnix, xiafs, nsdos, unsdos, sysv, 1505, hpfs, snbfs, ext3, nfs[] 
proc [] [| 
e OOO SS OOOO: (OO aha1542, in2000)0 
e JOO SÅ :ה ה ה ה הה‎ disk tape cdrom generi c[] 
e I000000000: COO0O0O0000000000000./Dcunent ati on/ 
net worki ng/ net- nodul es. txt TT) 
s 000 ORMJOOOO 
azt cd: Aztech, Qrchi d, (kano, Warnes 
cn206: Phi 1 i ps/ LM MO 
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gscd: (11 dstar GIR 420 
ned, nedx: Mtsum 1120, 1 














opt cd: Qotics Storage Dol phi n 8000AT 
sj cd: Sanyo OR HMA 
sbpcd: Mt sushi ta/ Panasonic G52x, (፲56፳5 POO, 


Longshi ne ICS 7260, TEAC CD 55A 
sonycd535: Sony CU 531/535, CU 510/ 515 
e 000000000000 
Ip D0000 
binfnt elf: df [100 
binfnt java: java 0000 
15016: cd-rom[] [] 
serial: [ [] [] tty[] 
00000000 Ex D D D DDD 0 00 0 DDD DD 00 DDD D D 0 D 0 D U 
U D DD 0 0 D DD 00 DD DD D D D D D D D D D D D 0 D 0 D 0 D 0 0 D 00 0 0 U 
DU DD DDD በበ በበበበበበበበ[በበበበበ 30 0 DD YMNI0“ Y 0000000 
በበበ DD 0 0 0 0 DDD 0 DDD DD DD 0 0 Dr" MD DD DDD 000000 D 0" N 
םםםםםםםםםם‎ 


םםםםםםהתם 10.1.2 


U U 0 U D U D 0 0 0 0 000000 0 UD 00 0 0000 0 D U 0 U הפר‎ 
בםםםםםםםםםםםםם‎ TAD D D 0 0 በ በ በ በ (rout) ህጪ VEAT[J O 
U D D 0 D 0 [00 [0 kerne d0 0 D D D D VAD D D D D 0 0 0 ins 0 D U 
J (unmount) הז‎ D D D 0 D 0 DH D D D UD PAD D D D DD 0 0 000 D U 
O0O000000000000000000000000000000000000 
OOO0000000000000000000 10BQ0000000000000 
00000000 bH D 0 0 0 0 D D 000 0 00 D 00 0 00 0 0 000 0 0 U 
U U U UU U 000 U 
0000 האתט‎ 00 D 0 0 0 00 0000000000 00000 DD 000 0 U 
U UU D 0 0 0 0 0 0 0 0 0 0000000 0 0 UD 0 0 0 0 D D 00 0 0 D D ሀ በ UU ms 
U U 0 UD 000000 U 


FBE EE EINER E) 
EIE E=] EX EZ: Ea) ERT 




































































E 


























10.1.3 limx מםםםםההה‎ 


U U U U D U 0 U 0 U D 0 0 00000 U 

e J00000000000000000000000 

e [0000000000000000000000000 
U U U U D U 0 0 0 U D 0 0 00000 U 
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e J000000000000000 

e [000000000000000000000000000000000000 
U U U U DU U 

e U UU UU UU DUDUDU 0 U DU D D D U D 0 0 U DU D 0 D U D 0 0 0 D U 
U U U U UU U 

e J00000000000000000000000000000000 

e ההההםהםהםםםםםםםםםםםםםםםםםםםם‎ D 0 U 8 
















































































e [000000000000000000000000000000000000 
U U 

U U U U D U D 0 0 0 D 0 0 0000000 0 0 U DU 0 0 0000 00 0 0 DU U 
በገ በ በ U D 0 0 U D 0 000000000 U 


10.2 0000 


D 0 D D 0 0 0 0 0 D 000 0 000 D 000 0 0 DU 00 0 000 000 U‏ האתגם 
U U U በ በ U 10 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U DU 0 0 U‏ 
U U U U 0 U D 000 U‏ 


10.21 OOOO 


100000 


DU 00 0 0 NOON DN 0 000 0000000000 U‏ םםםםםם 
U U DD 000 DU 00000 0 0 Dos JOOO0000000000000000‏ 
U U U U U U D 0 0 0 0 U 00000000 U U 0 0 U D U D U 0 0 D 000 000 U‏ 
U U U U U U D 0 0 0 0 U 00000 000 U D 0 0 U D U D U 0 0 D 00 0 000 U‏ 
U DD 000000000 0 Go 00 0 0 0 DD 0000 0 0 0 0 U‏ 
ם"םםיםםםםםםםםםםםםםםםיםם kernel / ksyns. [በበበበበበበ‏ 
U U U 0 U U‏ 


/* process nenory nanagenent */ 











EL J TES p= E) 











EXPORT SYM] exit 
EXPORT SYM] exit 
EXPORT SYM] exit 


files]; 
fs[] ; 
si ghand] ; 


EXPORT SYMKX1|[| conpl ete and exit] ; 
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: 
፳ 
5 
8 


SYMBOD wake up process[] ; 
SYMBI] sleep on] ; 
sleep on ti neout[] ; 
SYMBOD interrupti ble sleep on] ; 
SYMBOD interrupti ble sleep on ti neout[] ; 
SYMBT] schedul ef] : 
SYMBO[] schedul e ti neout[] ; 
בא‎ | jiffies[] ; 
SYMBOD xtine] ; 
SYMBI] do getti neof day[] ; 
EXPORT SYM | do setti neof day] ; 
םםםםםםםםםםםםםםםםםםםםםם‎ 2600 SM DD 0 D DON 
በበበ 70000007007 00 DD 00000 0000000 DD 000 DD DD D 
U U D D D 0 0 0 0 0 D D D D 0 D 0 D D 0 D 0 D D D D D U 
U U D 0 D 0 D 0 0 0 D 0 D 0 D D 0 D 0 D 0 D 0 D 0 0 0 D 0 D D D D 0 D 0 0 U 


U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D 0 0 U 
struct nodule synbol 
{ 


FEE 





unsi gned long value; [] *[] [] 
const char “nan: /*000 


*םםםם 


bi 

U D D D BENT םםםםםםםםםההשוםםהםםםםםםםםההה הש‎ 

00000000071 ה‎ D D D DD 0 D D 0 0 D D D DD 0 0 0 0 D 0 D 0" Ú 

በ ንቨበበበበበበሀበበሀበበበበሀበበሀበ በበበሀበበበ”በበ”በበበሸ[በ[በ[[ 

U U D U D U 0 D 0 D 0 000 U 

[| EXPORT SM ח.‎ 0 0 0 O በ incl ude/1i nux/ nodule. hg [] 
Hdefine MOIE SIR NG 10 xX] Tk 




















#define MILLE SIR NY] xX] MOIE SIR NG 1] x] 
#lefine | EXPORT SYMB] sym str] \ 
const char | kstrtab #ynh] \ 
. attribute [| | section] ".kstrtab'[] QQ = \ 
const struct nodule synbol  ksyniab #4ym \ 
. attribute [][] section] " ksyntab"97 00 = \ 


+ U unsigned long] &ym | kstrtab ##ym} 

8 defined MIVERSIONS) || ! defi ned( OOI G MIVERSI OS) 

#define EXPORT SYMKl(var) __EXPOX SYMA (var, እብ፲1፻ SIR NA var)) 

00000 EPON SYMB ( schedul )] 0000000000000000 

O U EPON SYMBC(schedul 6)[] O O O O EXPORT SYMBA( schedule sched- ul e”)[] 
EXPORT SMN D D D D 0 0 0 0 D 0 10000000000 kstrtab schedule 
U 0 D 000 D 0 D 00 DD DD 0" schedule” DD D 0 D 0 0 D 0 D በ በ .kstrtab p 0 
םםםםםםםםםםםםםםםםםםםםם‎ 200000000000 _kstrtab 
schedule [| nodule synbol 7000000000 schedule]. kstrtab schedule [] 
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በበ1 0100000000. ksymab D OG O D nodule synbol QO 000 valueQ [ 
OO schedu e D D 0 D 0 D D 0 D 0 በ ፲ naneQ 000 D D “ schedule” [| 


20 0 H D (Mdule Ref erence) 


O0OO000000000000 በሀበ በሀ በበበ በሀበ 000 00 U 
OO WATOOOO0 PAD D 0.0 D D D D 0 D 0 DDD D VATI D D DUDU depend] 
U הצ‎ D D 0 DU 0 በ FAT OD יהשצםםםםםםםםהםה בש‎ 0” በበበ 


םםםםםםםםםים"ם 
struct nodule ref‏ 
{ 
































struct nodule *dep; *םםםםים"*!‎ 
struct nodule *ref; *םםםםים"*!‎ 
struct nodule ref *next ref;/*0 *חההההההה הה‎ 


L 
000" dep” "םםםםהםםםםםהםםה‎ ref” 000000000000000 
0000000000 A00 BT Bn DD DDD DDD D D 00 DD 


3000 


000000 ₪ [00000 
struct nodule persist; /* 000 */ 


struct nodul e 
{ 
unsigned long size of struct; /* 000000000 sizeof[] nedue] */ 
struct nodule *next; /*O000000 * 
const char *nane; /*0000000 4000* 
unsigned long size; *הםהההםהההה1*/‎ 
uni on 
{ 
atomic t usecount; /*JOOOOO0O0000000*% 
long pad; 
} uc; /* Needs to keep its size - so says rth */ 
unsi gned 1 ong flags; םםםםה*!‎ * 
unsi gned nsyns; םםםםםםםם*!‎ v 
unsi 0061 ndeps; /* 00000 */ 


U U 
struct nodule synbol *syns; /* D DD DD 0 0 0.0 D D D D nsyns */ 


struct nodule ref deps; /*7 000000000000 ndeps */ 
struct nodule ref *refs; 
int  *initQ D voi d] ; !* 00000 int måle [00 * 
void [] *cleanud] D vid]; /* D 0000 cleanup nodeg 0O00 ” 
const struct exception table entry *ex table start; 
const struct exception table entry *ex table end; 


/ጭ በበበ DD DD 0 D 000 DD D D D D 0 D nod nenber_ 
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present )] *אםםםםםםםםםהםהםהה‎ 
const struct nodule persist *persist start;/*0 0 0 0 */ 
const struct nodule persist *persist end 
int [| “can unl oad] [| voi d] ; 


























int runsi ze /ማበገበበ” 

const char *kallsyns start; /ብሚበበገገ ገበበበበበ * 
const char *kallsyns end; 

const char *archdata start; ፆሥበበበበበበበበበበበበሣ 
const char *archdata_end; 

const char *kernel data; /ግሚ]1 */ 


L 
U በ በ mood ef | | D D D flags 0 0 0 0 D 0 0 በ 
/* Bits of nodule. flags. */ 

















#lefi ne MD UNN T NT ZED 00*0000000* 

#lefine MD AN NG *םםםםםפ*ה:‎ 

#define MD LH EIFD 20*00000000000% 

#defi ne MD AUTO FAN 4J*00000000000000000 

በበበ በ” 

#lefi ne MD VISITED 80*000000*# 

#lefi ne MD USED (NE 160*000000000*% 

#lefi ne MD JUST FREED 2 0*0000000ሣ 

Hdefi ne MD INTIAL ZING 64 0 YD 0 00000000 YOO 

U U U 0 D 0 D 00 0 0 00 0 0 0 0 0 D 0 0 0 0 0 U D DN 0 U D 0 0 D 0 (U 








O0O0000000000000000000000000000000000 rode 
00000 kernel nodule] [| kernel nodul ef] [| [] [] [|] kernel] nodule cf] [] 
#f defined] ONIG MILLE) || defined] GONHG KNISYMIJ 


extern struct nodule synbol start  ksyntab] ]; 
extern struct nodule synbol stop ksyntab[]; 








extern const struct exception table entry start ex table[]; 
extern const struct exception table entry stop ex table[]; 








extern const char start  kallsyns[] attribute QQ weak] [O ; 
extern const char stop  kallsyns[] attribute  [][] wag [| ; 


struct nodule kernel nodule = 


{ 
size of struct: sizeof] struct nodul ef] , 
UC: {AMC INT] 10 > 
flags: MD RIN NG 
syns: . start — ksyntab, 
ex table start: start ex table, 
ex table end: stop ex takle, 
kallsyns start: start kallsyns, 
kall syns end: stop kallsyns, 

i 


O0O00000000000000000000000000000000000 
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O00O0000000000000000000 exr6MnpIEBIE 0 0 0 0 0 D 0 0 tL 
U U 0 D 00 D 0 DD 00 D D DDD D D D 0 D D 0 D 0 UD 
בםםםםםםםםםםםםםםםםם‎ 00 NLD DDD D D በ በ int nedue()[] 
cleanup nodul e()0 D D D D D D D D 00 D 0 0 0 D 0 0 0 0 0 0 D 0 0 0 D 0 
םםםםםם‎ rets DDD DDD D DD D D syns[] start kevna" [00000 
בצ םםםםםםםםםםםםםם‎ 000 D 0 0 D D 0 0 0 D D init ב(‎ 
U D DD 0 0 D 000 U 
U D DD 0 0 D 0 D 0 00 D DDD D D 0 D 0 D 0 0 D D D 0 D 0 D DD 0 0 D UD 
በ] D DD exception table entry] D D 000 0 0 0 DD 0 0 DDD DD DDD D 0 D D 
|1[1[1]1111]1 [| [| [| [] [1] [] exception table entryQ 00000 start ex table 
በበ ገበ በበበ [በ በበበበበበበገበነገበበበበበበበበገበበበበበበበበበበበ[ 
በገ] በበ] በበበበበበበበ[በበበ 

OOOO kernel nodule] ה םםםםםםםההה‎ 0 D D D D 0 D D D D D D 


D D D D D 0 D nodule list [ [00000 
struct nodule *nodule list = &kernel nodul el] 










































































םםםםםהם 10.22 


፻0መሺበበበ000[00[0‏ בםםםםםםםםםםםםםםםםםםםםםםם 
DD 0 D D 0 0 D D D D D D 0 D D D 0 D 0 U‏ "ה insnod’‏ “00000000 
DD 0 D 0 D D 00 DDD 00 DD 0 D 0 0‏ ה 4 kernel d D D 0 D D ሀ D 0 D‏ 
D D D D D 0 0 0 0 0 D D D D 0 0 0‏ ה66 kernel / nodul‏ / 


10 D D 0 D D 0 0 D 0 int nedues() 


DU DD 0 DD DDD DD DDD DDD DD 0 D 0 DD D D 0 DD D minc l] D 
int nodul ss0] D D D DD D 0 0 D 00 00 0 0 000000 0 DD 000 D 0 DD D 
U U D D D 0 0 0 000000000000000 

NI 

* Called at boot tine 
*/ 
void init init nodules] void] 
1 
kernel nodul e. nsyns = stop  ksyntab- _ start___ksyntab, 


arch init nodules] &ernel nodul ef] ; 
} 
םם"םםיםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
ksyntab[][][] start ksymab[] ה‎ 10 0000000000 stop 98851 [| 


U D D 0000000000000000 በበ DD D D D D D D D D arch 111! nodules 
D000000000000 i3860 [|] [] arch init nodd 65 [] incl ude/i386/ nodule. h [] 
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U uuu 
#defi ne arch init nødul es] xf] do 1 } while [] 0] 


nooo 1መ60000000000 
20000000 


በበ 1መጩፀበ]]በበበበበበበበበበበበበበበበበበበበበበበበ[በበበበበ 
םם םם םםםםם‎ በ sys create mdu eL) D D D 000000000000 
screate node] D 000000000000000 

/* 

* Allocate space for a nodule. 

*/ 





asmi 09806 unsigned 1 ong 
sys create nodul ef] const char *nane user, size t size] 
{ 

char *nane; 

long nanelen, error; 

struct nodule *nod; 

unsi gned | ong 11 ags; 


if [] ! capable] CAP SYS MILE] |] 
return - EPERM 

lock kernel] [D ; 

if [] [] 0606] en = get nod nane[] nane user, Gane] | «0j + 
error = nanel en; 


goto err0; 
} 
if J size <sizeof] struct nodule] 406081 ed] í 
error =-HNAL 
goto errl; 
} 
if [] find nodule] nane] != [11א‎ 1 
error = - FFXI SI; 
goto errl; 
} 
if [] [] nod =] struct nodule *[ nodule nap] size] [|| = [11א‎ í 
error = - ENM:M 
goto err1; 
} 


nenset[] nod, O, sizeof[] *nod] [] ; 

nod- 2126 of struct = si zeof[] *nod] ; 

nod- mane = [] char *[] [| nod + 11] ; 

nod- >si ze = size; 

nencpyf] [] char*[] [] nod] , nane, nanel en] ; 


put nod nane[] nanel] ; 
spin lock irgsave[] &wdlist lock, flags] ; 
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nod- next = nodule list; 
nodule list = nod; /* link it in */ 
spin unl ock irgrestore] &wdlist lock, flags] ; 


error = [] long] nod: 
goto err0; 
6፡1: 
put nod nane[] nanml] ; 
err0: 
unlock kernel] [D : 
return error: 


} 
በገ] U 0 UD 00 0000000 U 
° capabl e( CAP SYS NDUB[] D 0 D 0 0 D D 0 0 D 0 00 UD 
e 00 size DD 000 II השס‎ 0 0 DD D D 0 0 0 D 0 0 DD 0 0 D 
U U 00000000 aze DD 000 00 0 U 
° get md rane] D D 0 0 0 D D D D D 0 U 
e התה‎ D D 0 D 0 0 D 0 0 0 0 0 DD D 0 D D 0 0 D D 0 D 0 0 0 0 U 
° 00 nodule nap] D D D D D 0 0 12600 000000 ጩ1ዐ[)0በ[በ[በ00[0 
U U U UU U 000 U 
° mensetl DD D | | nodleN םהה‎ D D D 0 0 0 OG 0 0 0 DD D nodule nap 
U D D D D D D 0 0 00 DD D mdu e" D I H 0 D mate) 000 ה‎ DD D D 0 0 
00 module D 00 000 D D D DON D DDD 00 DDD DD D D 0 0 0 
- Jo ה‎ 0 0 00 DD D D 0 0 0 DD DDD D 0000 DD D U 
° put nod ה(‎ 00000 nam D D D] 0 D በ 
e 00000000000 nodule list J 00000 


A) DD 0000 U 


U D 0 00 DDD sys create nodded D 0 D D D 0 0 D 0 D D 0 0 D D 0 D D 0 0 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U DU ቨ ከ U 
sys init modul [)| 0000000000000 int הפצש‎ 0000000000 
U U U [በ በ በ U D 0 0 0 D 0 0 0 0000000000 U 


U D D D 0 0 D U 
asmi 9806 long sys init nodule] const char *nane user, struct nodule *nod user[] 


OOOO nane user D D D D D D 0 0 በ በ md user 000000000000 
nodule] [] [] 

U D D D 0 0 D D D 0 0 0 U 

e sys create nodul d] DD 000000000000 mdu ep D 00000000 
OO00000000000000000000000000000000 mdu e D D 1 
U D D DD DD הש‎ DD 0 0 0 D 00 0 0 0 0 D 00 0 D 0 D D D 0 0 D mue 
U D D DDD D 0 made D 0 0 0 D 0 0 D 0 0 D D 0 D mdu e DO 2200000 
OOOO 24000000 mdu e) D 0000000000000 måde[ D D D D Ú 
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U U D U D 0 0 0 D 0000 U 


000 mdu eD D ü D 0 DD DÚ 
םםםםםםםםםםם‎ 























םםםםםםםםםםם 


nodle D D D D 0 0 2.40 D D persist start DD 000‏ בםםםםםםםםםםםם 


e הש בםםםםםםםםםםםםםםםםםהםם‎ 0 00 DD D D 0 000 U 
U D D D D D 0 0 DDD mdu eD D D D D 0 0 0 0 D D הש‎ D D 0 0 0 0 D 0 0 U 








UI Linux [ ul 


U D D D D D D D nodle O00 size of struct 0 [| [] 


















































000 הפב‎ D በበበ, በ በ በ DD በ በ በ nodleN DO 











e 00000000000 הש‎ 0 0 00 D D D D 0 0 


- Bi B d uaa 


U U 0 U D 0 UU D ሀ በ ሀ በ | Ü nane user] D 0 D ሀ በ 


U D D DDD 0 UD D D 0 0 0 DD D D D D 0 0 መጩፅፀበበበ00000000[00ቨ 
U DD D 0 0 0 0 D D D D 0 DD D D D D 0 הש‎ 0 DDD D D D D 0 0 0 0 D 0 0 U 


U U 0 U D 0 0 0 D 0000 U 


U uu 


e JO00000000000000000000000000 


e J00000000000000000000000000000000000 


U U 0 U D 0 0 0 D 0000 U 
U U 0 U D 0 0 0 D 0000 U 
םםםםםםםםםםםםםם‎ 


000 delete nodul e()[ 00000 nodulef] [] [| nude list [] O00 


« 00000000D 





O0O0000000000000000000000 
O0O0000000000000000000000 


[] 
[] 
[] 
ו םםםםםםםםםםםםםםםם‎ | JUD DD 








OOO00000000000000000000000 


init nude] D 0 D 0 D D D D D D D 0 0 D D D D D 0 D mdu e D D D D D D D init 


U U U D U D 0 0 0 0000 U 


OOO0O0000000000000000int nude 


O0O0000000000000000000000 220000 
47 D 000000 sys delete nodd e() 


U U 0 0000 U 
U U U U D U D 0 000 U 


U D D DD םם םםם‎ delete mdu ה(‎ D D 0 D H [0 UU sys delete nodd e()[| 


asmi nkage long sys delete nodul ef] const char *nane user[] 


O0O000000000000000000000000 


[| U U [] [| nane user, nane user] D D 0000000000 nane user[] D II 000 


O0O00000000000 
0100000000 
U U 0 U D U 00000 U 


U U U U U 
U U 0 U D U 00000 U 
በገ በ ገበ D 00 0000 U 
U U U U D U D 0 000 U 
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U U 0 U D U 00000 U 


U U U በ በ U D 00 00000000 0 U 0 UD 000 U 


U D DDD 00000000 DD DDD DDD 0 rets 00000 D0 D DO 000 0 U 
םםםםםםםםם‎ MDINGE I D D D D D D D O000000000000000 


























000 cleanup nodu EO] D DD D D 0 0 D 0 U 
[] 
OOO0000000000000000000000 refs 








00000000 refs DDD DD 000 DD DDD 00000 DD DD 0000 U 
































םםםםםםםםםםםתם 
U U U | mane user በበ በበ 0 0 0 0 0 0 0 0 D 0 0 0 0 U‏ 
e 0000000000‏ 

e 0000000000000 MD ጳ፲ህ]ፒሎክ OOO 

e U UU UU UU DU UU DUDU 0 UD U 





םםםםםםםם 
םםםםםםםםם 
e [00000‏ 
000000 ה0 init nodul el] [] [| create nodul | [] O delete nedul‏ 00000 
בםםםםםםםםהםם ה 4 OO000000000000000000000 query‏ 
በ፲ insmd[] rmpod DD DD 0 0 0 D 00 B 00 0 D D B. B. 0 0 | D D 0 00 D D D D D‏ 
םםםםםםםםם 


D D D D ፲ D request nodu e() [J‏ חפ 


00000 השפ‎ DDD 0 D 0 D 00 D 0 DD DDD 0 DD 00 DD 00 0 D 0 D 
U U D D D D U U D D D 0 D U U 0 D 0 0 0 0 0 0 0 0 0 0 0 0 0 0 D 0 0 0 D 0 0 D U 
OO packet በበበበበበበ]በበበበበበበበበበበበበበበበበበበበበበበበበ[በ[በ 
O0O00000000000000000000000000000000000 
request nodul e()0 0000000000 

request nodul e()[] [] O kernel / 8090 ር [] [| 

A A try to load a kernel nodule 

* @odule nane: Nine of nodule 




















* 


* Load a nodule using the user node nodule loader. The function returns 
* zero on success or a negative errno code on failure. Note that a 

* successful nodule load does not nean the nodule did not then unl oad 
* and exit on an error of its ow. Callers must check that the service 
* they requested is nowavailable not blindly invoke it. 

* 


* If nodule auto-loading support is disabled then this function 
* becones a no- operati on. 
*/ 
int request nodul ef] const char + nodule nanel] 
t 
pid t pid; 
int witpid result; 
sigset t tnpsig; 
int 1; 
static atonic t knod concurrent = AMC INT] 0]: 
#defi ne MX KMD CNIRREN 50 /* Conpl etely arbitrary value - KO */ 
static int knod loop nsg; 


/* Don't allowrequest modul ef] ] before the root fs is neunted! */ 
if ך‎ ! current->fs->root [ 1 
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pri nt k] KERN ERR"request nodul el %]: Foot fs not nounted\n", nodule nanef]; 
return - FPERM 
} 








/* If nodprobe needs a service that is in a nodule, ve get a recursive 
* loop. Limit the nunber of running knod threads to nax threads/2 or 
* MX KMD GNNIRRENL whichever is the snaller. A cleaner nethod 
* would be to run the parents of this process, counting how nany ti nes 
* knod vas invoked. ‘That would nean accessing the internals of the 
* process tables to get the command line, proc pid cndline is static 
* and it is not worth changing the proc code just to handle this case. 
* KAO 
*/ 
i =nax threads/ 2; 
if i > MX KMD CONIURRENI] 
i = MX KMD CHILD, 
atomic inc] Gnod concurrent] ; 
if [] atomic read] Sknod concurrent] Sil] + 
if [] knod loop nsg++ > 5] 
pri nt k] KERN ERR 
"knod: runaway nodprobe loop assuned and stopped n"[] ; 
atonic dec] Gnod concurrent|] ; 
return -ENMM 
} 


pid = kernel thread] exec nødprobe, [| void*[] nodule nane, O]; 
if [| pid >0[ + 
pri nt Å] KERN FRR"request_nodul 0] 96]: forkfailed, errno \ג%‎ n", nodule nane, 


- d] ; 


atomic dec] &knod concurrent[] ; 
return pid; 
} 


/* Bock everything but S G LULU S IŒ */ 

spin lock ird] &urrent- >si gask I ock[] ; 

1881 g = current- >l ocked; 

siginitsetinv[] Seurrent- >bl ocked, si 00858] SW] | signask NG TOF] [I]; 
recalc si gpendi ng] current] ; 

spin unl ock irq] Scurrent- >si gnask 1 ock] ; 


vaitpid result =witpid] pid NIL VIN; 
atonic dec] &nod concurrent|] ; 


/* Alowsignals agein.. */ 
spin lock ird] Seurrent- >si gask I ock[] ; 
current- “bl ocked = tnpsi g; 
recalc si gpendi ng] current] ; 
spin unl ock irq] Scurrent- >si gnask 1 ock] ; 


if [D witpid result !=pid] + 
pri nt k] KERN ERR "request nødule[%]: waitpid] 98,...[] failed, errno An", 
nodule nane, pid, -veitpid result[] ; 
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) 


return 0 


} 
םםםםםםםםםהם‎ 
e JO request nodule] ה‎ D D D D DD 0 0 D 0 D D 0 0 0 0 D D 0 0 0 0 D 0 D 
000000000000000 
e ה‎ request nodule] D D D D D D 0 D 0 0 D 0 D D 0 D DDD D 0 D 0 0 
U D 00000000 Mp. OST) 00000000 tat 0000 tat D 0 D 0 D UU 
000 FAP D 0 D 0 DDD 0 0 D 0 D 00 DDD DDD 0 tat DD 000 DDD 0 
00000 M.G םה‎ በ tat 00 DD DD 0 D 00 D 0 DD DD 0 D 0 0 D 0 0 
U U DD 000 DD DD 0 DD 0 0 0 በ በ 00 knod concurrent N0 000000 
םםםםםםםםםםםםהם‎ DD MX KMD ONIRÆNT D D DD D 000000 
U U DD 000 DD DD 0 0 EH rax theradsM] 0 0000000000000000 

e D U 0 0 0 0 D D םם‎ D 0 O kernel thread) D בה‎ B 0000 
exec_nodprobe{] D D exec nodprobe] O0 00000000000000 execve() 
U D 0 D 0 0 [በ በ በ /sbin/nodprobe] 0 0 0 nedprobe[] D D 0 0 D D 0 በ በ በ [ 
000000000000 
e I0000000000000000000 הצא‎ SG] DD 0 DD D 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ vetpidi tt 
U 0 D D D D D D D D exe nodprobe] NO DD DDD D 0 0 D 0 D 0 00 DDD DD 0 
OO witpd] 00 NONONO 0 0 DDD 000 OD D D D 0 0 D witiaOOOOOO 
OOO exec_nodprobé] DD D D D D 0 D 00 D D D DU D D wi ni1D 0 0 0 0 D በ በ” በ 
var/log/ nessage" [] 0 Ll 0 DD B. D D [ 












































10.3 [DD DD UU [] 


103.1 OOOO 


000000000000 1000 םםםםםםםםםםםהה האש‎ 2000 
O0O0000000000000000000000000 
O0O000000000000000000000000000000000000 
በ D D 0 0. ፲ 0 kernel dD D D D 0 D 0 0 0 0 U 

U ፲ D D D OO kernel dD D D 0 0 0 D D D D D 0 D D D D D D 0 0 UU kernel df] 
OOO000000000000000 IPE Inter- Process Com cati oO D D D D 0 D Ú 
በ D D 0 በ kernel dD 0 D 0 00 D D D D 0 0 0 

₪4 D 0 00 DD D D D D 0 0 0 DDD DD 0 D 00000 DD 0 D 0000 U 
0000000000000 PD DDD 00 D D 0 0 0 በ D kernel dD D 0 D 0 0 0 UD 
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U D D 0 በበበ ה‎ D D 0 0 D 0 በ በ በ በ፲ በ kerneld GQ 0 0 D 0 D 0 0 D D 0 
insnod D D D 0 0 0 D D 0 D 0 00 0 DD DDD 0 D DD DDD DD DDD 0 
/1ib/nodul es/ kernel verston D D D D D 0 D 0 D 0 D D 0 D 0 0 D D D D 0 DD 0 
םםםםםםםםםםםםםםםםםםםהם‎ aot 0O BED D H D 0 D 0 በ insnods በ 
U D D 000 sbin 000 D DDD 00 D 00 U 
םםםםםםםםםםםםםםםטהם‎ 
U 20 D 00 0 D 0 00 0 0 00 0 0 0 D 0 D םם‎ 0 D 0 /11፡// ጩጩመ[ 
kernel - versi oy 0 0 0 
በሟጋበበ DD 0 D D 0 D DD በ፲ הש‎ 0 D 0 0 0 00 D 0 በ በ በ በ create 
nodul e( JAN D 0 D D 0 0 D 0 0 D 00 0 D 0 0 D 
OÆ D הםםםםם ה את‎ query mie JOO D ü ü d D 0 0 D 0 0 D 0 D 
םםםם‎ 
0500 הא‎ D D D D D | query modu el 10 n D D ü D D 0 0 D D 0 D D D 
U D DD 0000 DDD 000 U 
U 0) 0 0 DDD 0 D 0 D በ0000 create nedu et 10 (1 B D U D D 0 0 0 0 0 U 
በበገበበበበገበበበበበበበበበበበበበበበበበበሀበበበበበበበበበሸ[በ[[በበ 
00000000000 
הםםםםםםםםםםםםםםםםםםחם‎ መጩፀበበበበበበበበበበበበ 
U DU 0000 DDD 0 0 0 0 0 D D D D D D 0 0 0 0 D D D D D D D 0 0 0 
init nodul e( ה(‎ 0000 nodleQ || | 111111 OO D D init nedule( )O 
U D D 00 0 DDD D 0 DD DD D D D cleanup ጩመጩፀ )በበበበበ ዉጩጩ[ 00 
00000 demm nodule( 10 [1 0 B] 0 0 D U D UU 
U 800 init nodule( 10 0 D 0 0 D 0 D 0 D DD DD 0 DD D 000 D 0 D 00 በ 
በበበ በበበበበበ[በበ[ 
ገበገሀ[[በ0ሀ0[0[00000 0 ሀ /8988በጠመበ (0 0000000000 
םםםםםםםםםםםםםםםםםםטם‎ 
0200 הנ‎ D | |] D query me ) D 0 B D d D 0 0 D 0 0 D 0 UD 



















































































[ma ב‎ TH ET E 





U U 
03000 הא‎ 0 D በ | D D query mdu et 10 D D 0 0 0 0 D D D D D D D D 
OOO000000000000000000000000000 

D 4100 delete mdu eL 10 D 0 0 0 0 DD D D 0 0 0 














10.32 U DU 00000 U 


U D 0 0 DDD DD DD DD D D D D D insnodQ rood] D D 000000000 
U D DD D D D D D 0 D D 0 D 0 D D D D 0 D D D D D 0 D D D D D D D D D nn[ 0 U 
uu 

U D D D 0 0 D D D 0 D 0 D 000 D DD DD D 0 U 

insnod serial o 
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በ D D serial -.00 DDD D D 0 0 0 
U U U U D U 0 00000000 00 0 U D U 0 U D U 0 0 0 000 0 00 0 00 U 
U U U U 


D D D D በበ D በ ה‎ D D 0 DD D 0 D D 0 
nsdos.o: unresolved synbol fat date UN X2dos 
nsdos.o: unresolved synbol fat add cl 1 
nsdos.o: unresolved synbol fat put super 
































U D D D םםםםםםםםםםםםםםיםםיםםםםםםםםהםםה ה‎ 
/proc/ ksys] D D 0 DDD D D D D 0 D DD 00“ fat date uixados" 0 [] 0 
OO0000000000000000000000000000000ds.0J000 
OOO fa. og D 0 በ D D D הפפ‎ D በ fat.of D DO D DU U D U D /proc/ nodul es] 


U U U U 000000 0 000 0 00 0 0 0 0 0 0 0 00 በ U 
[8005 5632 0 [] unused] 





















































በ ገ][ በ በበበ በበበ በ በበበሀበበበሀሀበበበበሀበበበሀሀ[በ[በበበ[[በ 
[] depod [| nodprobe 0 [ D [] [] insnod[] OO 
በ] D በ] D D በ " kernel / nodul eversi onmsnatch” በ] 11111 1101 D D 0 D D D ] 






































U U 0 D 00 0 0 DD D 00 D 0 U 

U D DD 0 0 D D D 0 0 0 D DD D D D D D 0 D 0 D D D D D D D D D D 0 0 D UD 
םםםםםםםםםם‎ 10000 ፤1፳8በበበበበበበበበበበበበበበ[በበበበበበበ[ 
םםםםםםםםםםםםםם‎ 

insnod ne. 0 1 0=08400 irq=l0 

U D DD DD םהסע םםםםםםםםםםםםםםםםםםםםםהה הפא‎ 
በ 0x4007 D D D D በ በ በ D IND 10] 

U D D D 0 0 D 0 D 0 0 0 D DD D D D 0 D 0 D 0 D D D D 0 D 0 D DD 0 0 D 0 U 
U D D mem" 00000000000 Linz] 00000000 D Linux ONOI] D 1] 
U D 0 D 00 D 000000 U 

U D DD 0 0 D D D 0 0 D D D D D D D 0 D 0 0 0 0 D 00 0 D D D DD 0 0 D 0 U 
በበበ 0 SBD DD D 0 00 0 DDD 0 D D DD D D UB 00000000000 
U D D DDD DU usbcore of 00000000000000 usbcoreoG [00000 
U D D D הש‎ 0 0 D 00 0 0 0 0 DD 000 D 0 DD D U 








usbcore. o couldn't find the kernel version this nodule was conpiled for 

D 0 D D 0 D D Uinsnedy vsbcore.o0 O000000000000000000 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 
םםםםםםםם‎ 


U 0 D 0 D 000 DDD 0 D ה‎ | በ በ nme D 0 0 0 0 D 
rnmod ne 
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[ Linux [ [] [ 


104 OOOO 


U U U በበበ በበበ በ በበበ በበ በበበ በ በበበ በበበ በ U U 0 0 U D U 
000000000200 2200 220 24000 אא‎ 0000000000. 

















םםםםםםםםהםםםהה 10.41 


OOO00000000000000000000000000000000" 00" 
U D DD 0 0 D DD 0 DU D D D D 0 D D D D D D D D 0 D 0 D 0 D D 0 0 D D 0 DUO 0 U 
U D DD 0 0 D DD 00 DD DD D D D D D D D D 0 D 0 0 D 0 U 

U D Onydri ver. o0 በ] Hn 22.10 000000000 D 0 D D D 0 D 0 0 nux 
2.2.20 000000 nydriver of 00000000 2220000000000000 
P0000 000000000000000 
0000000 000000000000000 000000000000000 
0000 רש‎ ver. of] [ [| U ה ה ה ה הפ אפת.‎ |] " 221000 nydriver.of [] 
U DD DDD Dms 22 1000000000000000000 2.2.20 0 0 [0 insnod 
U D D D 0 0 D 0000 DD 00 DD D 00 D D 0 U 
U D 0 Gn 2210 22200000000000000 øydriver.o[ 00 
nydriver.o] D D 111 0 D 0 0 0 D 00 DD DD DDD 0 DD 0 D DD 0 00 0 0 
U D D D 0 0 D DD 00 DD DD D D D D D D D D D D D D D 0 D 0 0 0 0 D 00 U 
U D D D 0 0 D DD 00 DD DD D D D D D D D D D D D D D 0 D 0 D 0 0 D 00 U 
U D D D 0 0 D 0000 DD DD D D D D D D D D 0 D D 0 D 0 D 0 U 

U D D U D insned[] 0 0 -£ D D D D D innodG@ DD DDD D U U 00000000 
U D DD 0 0 D DD 00 DD DD D D D D 0 D D D D D 0 0 0 U 
U D DD D 0 D በበበ 0 D D D D D D 0 D D D 0 D D 0 D 0 0 0 D D 00 0 U 
U D D 0 DDD DD DD D 1mmdD D 0 0 0 0 0 0 D 000000000000 
በበ] DDD DD DD DD D D D D DD GNIGMDERTOSOOOOWOO 
U D D D D 0 D D D 0 D 0 D D 0 D D D 0 D D D 0 0 D D D 0 0 D D D D 0 D U 
םםםםםםםםם‎ - D GONH הטנ‎ D D D] D 0 [ 
םםםםםםםםםםםםםםםםםםםםםםם‎ BET השפ‎ n D D D D D D 
בםםםםםםםםםםםהםםםםםםם‎ register chrde 000000000000 C 


U U U 
#defi ne regi ster chrdev regi ster 0100 0 


D register chrdev DOO register = O0 0 00000000000‏ ם 
000000000000000000000000000000 11 הש register‏ 
םה register chrdev] O‏ מםםםםםםםםםםםםםםםםםםםםםםםםם 
U [| register chrdev Rc8dc8350[]‏ 1[ ם U‏ ][1[1[01| 
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1042 NG] 209 2200 AOOO 


በ] ime 2.000022000000000000000000000000000 
םםםםםםםםםםםםםםהם‎ ADD DD NO םםםםםםםםםםםההא‎ 
OOO0000000000000000000000000000000000000 
U U U U 0 U D U 


םםםםםםםםםםםםםםםםת 


OO Dm םםםםםםםםםםםםםםםםםםהםההשטעםהםהה*21‎ 
O0O00000000000000000000000000000000000 
OOO0000000000000000000 verify are) 000000000 
00000 nenepy tfsOOOOOOOOO000000000000 verify area0)[] 
OOO000000000000000000000000000 
በ 21x]000000000000000000000000000000000 
O0O00000000000000000000 SRO000000000000 
verify area) ה‎ D D 0 0 00 D D D D 0 0 0 D DD DD 0 D 000 DD D D D DU 


copy to user OD 00000000‏ םםםםםםםםםםםםםםםםםםםםהם 
if [ copy to user [] ubuff, kbuff, length] O return - FAUT‏ 
































U U 
U U 
U U 
U U 









































000 ጨመ 0 D D D D D 0 D 0 D buff 0 0 0 0 0 0 D D D D 0 lemthn 00 D D 
000000 copy to user (]በ0በ[በ[በ0 D 0 00000000000000000000 
U U 0 D 0 000000000 0 0 - መህ፤፲በበበበበበበበበበበበበ8በበ[[በ0[ቨ 
U U U UD U D 00 U D 0 U 


if [| copy fromuser [] kbuff, ubuff, length] O return - FFAUT; 
םםםםםםםםםםםםהם‎ verify area ה‎ 000000000000 


20000000 


000 21414 000000000000000 00 ה שש‎ ü ü d D O UU D U 
0000000000 400000000000000000000000000000 
D DD 00 D DDD DDD DDD file operati ons 0 D D D D D D struct inode *[] [] 
D D struct dentry >D D D D D D D D D D 0] inod D 0 D 0 0 D D D 0 

struct inode “i node = dentry- >Q i node; 

OO dentry 0 D 0 0 D D D DD 0 D DD D DD D D 0 D DD (node) D D D D 0 U 
D DD DDD DDD DDD DDD በ DD file operationsQ (] D 00 D 0 DD 00 D 0 0 
ם‎ inode] 0 [] dentry D 0000000 

D 0 DD 0 D DDD D נש‎ 00000 strut file "D 00000000000 
00000000 dent n) 

struct dentry *dentry =file- dentry; 

በበ file] DD file] 0 UU D 


OOO00 22200000000 
loff t 115668 [] struct file *, loff t, int]; 
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ssize t read [] struct file *, char *, size t, loff t *]; 
ssize t write [] struct file, const char *, size t, loff t ግ] ; 
int readdir [] struct file *, void *, filldir tp; 

unsigned int poll [] struct file *, struct poll table struct *[] ; 
int ioctl [| struct inode *, struct file *, unsigned int, unsigned long] ; 
int nmap [] struct file *, struct vmarea struct *[] ; 

int open [] struct inode *, struct file *[] ; 

int flush [] struct file *[]; 

int release [] struct inode *, struct file *]; 

int fsync [] struct file *, struct dentry *[] ; 

int fasync [] int, struct file *, int]; 

int check nedi a change [] kdev t dev] ; 

int revalidate [] kdev t dev] ; 

int lock [ struct file *, int, struct file lock 4], 


U D D DD file operatios) DD DDD D D 0 0 0 D 00 DD DD 0000 U 


O00000000000000000000000000 
static struct file operations nydev fops = 1 
open:  nydev open, 
rel ease: nydev close, 
read: nydev read, 
wite:  nydev wite, 
bi 
geclf D D D D OO NON 000000000000 D D 0 0 0 D D NBI 
D 0 DD 0 D DDD D אע‎ 2.20 D በ በ pread) በ 0 000000000 
םםםםהםםםםםםםםםםםםםםםםםםהם‎ IsekO0D 000000000000 
0000000 pead) בםםםםםםםםםםםםםםםהםהםהםםה ה המע ה‎ 
U 0 D D D D D D D D read)0 ה‎ 000000 4000000000000 


U U 
U U 
OOOO offset JO0OO00000000000000000000000000000 
U U 
U U 


L1 


O0O00000000000000000000000000000000000 
000000 sek) NO በ DD D D በ በ red wite םםםםםםםהה ה‎ 


םםםםםםםםםםםם 
if [] ppos != &ile--f pos] return - ESPI PE‏ 


OO ppos D D offset םת םהה ה‎ file] በ struct file] D DH d D 0 D [] 
read) 0 560 000000000 offset 00 file + pos 000000 pread) 
0 pwite) 0000000 offset በ 0 pos D በ በ በበ D D D 0 D DD 0 DDD 0 D 
OG 

OOO000000000000000000000 ps DDD DDD DDD 
U D D 0 U 


A) DD 00 U 


OOOO signal הת‎ D D D D D 0 D 0 0 D 0 DD 000 2.00 00 000 1 
if [ current- 51 0081 & ~current- xl 009611] 

22000 
if [ signal pending [] current] [] 
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4] 1/00000 


በገ በ D U D 0 0 0 D 0 0 0 0 000 U DU 0 U DU D 0 0 000 0 00 0 00 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U D DDD 00000 D MONO DD D ROOOOOOOOOOOOOOOOOOO 
םםםםםםההפאםםםםםםםםםםםםםםםםםםםםםםםהם‎ Dms 00 U 
U D D D 0 0 00 DD D סט‎ 0 0 0 D D D D D D 0 iorenap 10 0 0 D 00 D D 0 U 
U U U U U 


811/0011] 0 በ 0 0 U 


select) pllO0)000000000000000000000000000000 
בםםםםםםםםםם‎ 1/00000000000000sedetO[0000000000 
NO Helect()[ 0 U [[] ånx2 OJ MO [| 0000 file operations] [ [] | | sel ect) 
000000000000 6nx22000000000000 p10000000000 
(D D BIO LI C] 


gg0000000000 


U U 0 U D 00 00000000 0 U D U D U 0 U DU 0 0 0 0 0 0 U U 0 0 U D U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U U DU U 


םםםםםםםםםםםםהםםםםם 
static int nydata  initdata = 0;‏ 


םםםםםםםםםהםםםהםםםםם 
initfunc[] void nyfunc [] voi d] []‏ . 
1 






























































} 

_initdataQ הפוג‎ D DD D D 0 0 0 D DDD “OD DDD 0 U 

U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
בםםםםםםםםםםה:שםםםםםםםםםם‎ 


70 U 0 0 0 U 
U DD DD 000 DD DDD me 20000000000 


current- >tineout = ] 111105 + tineout; 
schedule QQ; 
linx 2.20 0 
tineout =schedule tineout [| ti neout[] ; 
በበበበበ በ በበበበበበበበበበበበበበበበበ[በአጩ 2.00000 
current- 51 וספת‎ = [111105 +tineout; 
interrupti ble sleep on [| &eit[] ; 
Linux 2.200 
tineout =interruptible sleep on tineout [| &eit, tineout[] ; 
በገ] በበበ በበ በበበ D D D D 0 D 0 D 0 0 D D D D D D D D D 0 0 D 0 U 
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U uu 
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[] 


380000000 


U U 


OOO0000000000000000000000000000 Dom 22x 


OOO bmx 2032000000000 


10. 


L 
0 2.00 


i] D D D D D ሀ በ በ BA] 


få ncl ude 4inux/ versi on h> 
#fndef KERNEL VERSION 
# define KEANE. VERSION] abc] 00 08] «18] +00ብ >8| +0 cD 
Hendi f 
41 D UNK VERSION GOE > KERNEL. VERSION] 2, 1,00 0 
# include dinux/mmh> 
static inline unsigned long copy to user [] void *to, const void *from 
unsigned long n) 
{ 
if [|| !verify area D VERFY WTE to, n] [ return ₪ 
nencpy tofs [ to, from n]; 
return 0; 


static inline unsigned long copy fromuser [] void *to, const void *from 
unsi gned long nU 
1 
if [| !verify area [] VERFY READ from n] O return n; 
nenepy fronfs [] to, from nl; 
return 0 
} 
# define _initdata 
# define initfunc] fund] func 
Hel se 
# include <asmiuaccess. h> 
Hendi f 
# fndef signal pendi ng 
# define signal pending] d [| O RU ->signal &+] p] - »bl ocked [] 
Hendi f 


43 000 2200000 4 


000 Dm 20000 000000000 2400000000000000 
2200 ደመ 1000009000 220 240000 


PevSOOOOO00 me 2400000000000 0000000/evo00 


U U U U 
U U U U 
U U U U 

U U 
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םםםםםםםםה*/ םםםםםםםםםםהםהההאתתאאםםםםם 
םםםםםםםהא םםםםםםםםםםםםםםםםםםםםםםםםםהם 
U U U UD U U D 0 0 0 D U 0 0000000 U D U 0 U D U D U 0 U DU 00 U‏ 
U D dv DU 00 DDD DDD D 00 DDD D D eva Q0000000000‏ 


























































































































DOO0000000000000000000000000000000000000 
OOOO000000000000000"/dæv/bæ )O0O0000000000000 
“ /dev/ideO/...” D D D D D D 0 0 000 DD D D 0 00 DD D D D 0000000 
OOO000000000000000000000BvQ /dvD D 0 DDD DDD DUU 
OOO0000000000000000000000000000000000000 
*םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ ጩ6፲ [| 
OO0O0O000000000000000BvS 0 D 0 D D D 00 0 0 DDD 0 D 0 0 0 U 
00 6 5 SD 1 1 OD 

D0100000000000000 

OOO00000000000000000000000000000000000 
OOO00000000000000000000000000000000000000 
OOOO000000000 register chrdev()[] unregister_chrdev()0 D O D I 0 0 HU 
00000000000000 devs register OD 0 0 000 0 0 0 D D 0 0 0 000 0 
OOO000000000000000000000000 devis uregisterOD D U D D 





























devfs register()[] devfs unregister() םהה‎ DB D [] 
devfs handle t devfs regi ster[] devfs handle t dir, const char *nane, 
unsi gned int flags, 
unsigned int naj or, unsigned int minor, 
unode t node, void *ops, void *info] ; 





void devfs unregister[] devfs handle t def] ; 
OO devfs handle t0 D መመበበበበበበበበ000100000000 DD D 
חיש‎ 00000000000 bves 0 D በ התא‎ D I J D DevESL 00 በ del 
flags] NO D D D D I D DVS FL HATT] 
naj or[] D D D 0 D DD DDD 0 DDD 00 0 
mnor[] D በ D D D D 0 0 0 0 D 0 00 DDD 0 
node] D D D D D D D D 0 D 0 0 0 D 000 0 
ops] [| O file operations [] block devi ce operations [] [1 [] D] הח‎ 
info] םםםםםםהםהםםםםםםה‎ file] UD private dataQ l 
םםםםםםםםםםםםםםםםםםם‎ DMGENMIJI D D D D D MR Ng] [] 
U D D D MOR NO D D 0 0 0 0 0 D ה‎ 0 D 0 LL D D] init nodule] O 
[] 1 cleanup nodule] 0 D D D 0 Ú 
int init nodule] voi d] 
dus 


EJ 








iff [ ret = register chrdev] MJCRNR OMŒ NME &device fops] | =] 
return ret; 


} 


void cleanup nodul e] voi d 
{ 
unregi ster_chrdev] MCR እዜ DM CE NM ; 


- 393 - 



































Ul Linux | ul 

















) 





OO0000000000000000000000000000 MENON] 


#nclude <i nux/devfs fs kernel. h> 


devfs handle t devfs handle; 





int init nodul e] void] 
1 
int ret; 


if [] [] ret = devfs register chrdev] MJ RN TMG NME &devi ce fops] |] = 01 


return ret; 


devfs handle = devfs register] NIL, 1605 DIN DEVES FL IFFAUT, 
MRN MNRN SIFÆR| כמא51‎ | SIWR 
&devi ce fops, NII] ; 
› 


void cleanup nodul e] voi d 
1 
devfs unregi ster chrdev MjCR NR TEM CE NM] ; 
devfs unregi ster[] devfs hand ef] ; 


) 
U 200 vap 0 000 D D D D 0 0 


devfs nk dir) D D D 0 0 D D D D D 0 DD D ta 0 0 00 DDD 00 0 


devfs register] | dir[] 


/dev/nydevice” D 0 000 DD D D 0 D 0 0 0 D D D D DD 0 0 0‏ *"םםםםםם 


devfs handle =devfs nk dir[] NIL, "nydevice", NII] ; 

devfs regi ster] devfs handle, LEM Œ ENIRY, DEVS FL DEFAUT, 
MAN MNRN SIFGR| SIRID| SIWSR 
&devi ce fops, NII] ; 

በሟጋገበበበበበበ[በ[በ[በ 


U U 0 U D U 0 00000000 0 U DU D U 0 U DU 0 0 0 000 0 D 0 0 DU U 
OO LSD 0 0 0 DD DD 300 D D DD 0000 D D D dn DUDU /dev/bad20 0 000 
D 200 vaù 00 DD D D 0 0 0 DD DD D D D /dev/iced/, /dev/idel/Q D D] D 0 
בםםםםםםםםםםםםםםםםםםםםםםםה‎ devs register series] 000 

















OOO0000000000000000 pintfOO D D format [00000000 


U በ DM GŒ MR" D D በ በ D D በ በ በ MNRSAR D 0 BU D D 
devfs handle =devfs nk dir[] NIL, "nydevice", NII]; 











devfs register series] devfs handle, "device%", nax device, DEVS FL IFFAUT, 
MRN MNR SIAR, SIFOR| SIRD| SIWER 
&devi ce fops, NII] ; 
O40000 
U U D 0 D D 0 D 0 0 0 0 U 
devfs register bl kdev() 
devfs unregi ster H kdev () 
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3] D D /proc [1 1 0 D 


םםםםםםםםםםהש 0[ D D U D D D 0 D DD D 0 D D 0 0 D D‏ 0 האש 
OO0000000000000000000000000000000000 0‏ 
OOO0000000000000000000000000000000000000‏ 
U U U U 0 U D U 0 0 000000 U‏ 

D 0 D D 0 0 D D 00 D detryf D 0000 DD 0 DDD DDD D D U‏ שא 


proc dir entry 0 0 00000 include/linwx/proc fs. h[] D 1 התה‎ 
struct proc dir entry + 


L 


unsi gned short 1 owino; 

unsi gned short nanel en; 

const char *nane; 

node t node; 

nlink t nlink; 

uid t uid 

gidt gid 

unsi gned long si ze; 

struct inode operations * proc iops; 
struct file operations * proc fops; 
get_info t *get_info; 

struct nodule "owner; 

struct proc dir entry *next, *parent, *subdir; 
voi d *data; 

read Yoc t *read_proc; 

wite proc t *wite proc; 


atomic t count; /* use count */ 
int deleted; /* delete flag */ 
kdev t rdev; 


U D D D D proc DD DD DD 000 DD DD [0 በ Dm 2.20 D proc dir entry 


םםםםםםםםםםםםהה 2.40 lime‏ םםםםםםםםםםםםםםם 
በበበ በበበበበበበ[00በ0[,ቨበ‏ 


በበ0[በ0[በ000000[00[00[ 0በ/መ96[[0[0[0[ በ0 በ0 D 0 proc dir entry U 


[ read proc [| wite proc) [1 LU [1 LU U 

















fo” 00 Dos 220000000‏ "םםםםם הא םםםםםםםהם 


foo proc entry] D (] D D D ü 
struct proc dir entry foo proc entry = + 


} 
proc 


nanel en: 3, 

nane : "foo", 

node: S 1፲ሺ፲፲)| S IWSR 
read proc : foo read proc, 
wite proc : foo wite proc, 


U U 0 U D U D U 0 D proc root D] 7 


struct proc dir entry proc root = í 


lowino: PROC RYT IN) 
nanel en: 5, 
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nane: "/ proc", 
node: SIFOR| SIRG@| SIX] 
nli nk 2, 
proc i ops: &proc root inode operati ons, 
proc fops: &roc root operations, 
parent : &proc root, 
bi 
U U U 
proc regi ster] &proc root, Son proc entry] ; 
U U U 
proc unrei gster[] &proc root, foo proc entry. lowing] ; 
ה‎ Linux 2.49 [] 
U U U 





struct proc dir entry *ent; 


if DD ent =create proc entry] "foo", SIRD| SIWER NII በ !=እ፤፲፤] + 
ent->read_proc = foo read proc; 
ent-wite proc — foo write proc; 
| 

U U U 
renove proc entry[] "foo", NII[]; 
000000000000 
በበበበበበበበበበበበበበበ/መጩዐበበበበበበበበበበበበበበ file በ 00 
U U 
ה‎ Linux 2200 
םםםםםםםם‎ 


struct file operations foo file ops = 1 





struct inode operations 100 inode ops = + 
default file ops : &oo file ops; 
bi 


struct proc dir entry foo proc entry = + 
nanelen: 3, 
nane : "foo", 
node : 5 כ א1‎ | 5 IWER 
ops : &oo inode ops, 
bi 
U U U 
proc register[] &proc root, 6400 proc entry] ; 
uu 
proc unrei gster[] &proc root, foo proc entry. low ino ; 
ה‎ Linux 2.49 [] 


םםםםםםםם 


struct file operations foo file ops = 1 





-396-- 



































U U U 
struct proc dir entry *ent; 


if QO ent = create proc entry] "foo", 5 א1‎ 2 | S IWS NUDO !=NUQ + 
ent- “proc i ops = oo i node ops; 
ent->proc fops = oo file ops; 


› 
U UD D U 
renove proc entry("foo", NID; 


A) DD 0000 U 


በበ] 0] በበበበበበበ[በ[በ D D DD በ በ] D block device operations] 11 O 
U D D D 0 0 D DD 00 0 D 00 U 

10000 

በ Dom 22 הה‎ 0 0 DD 0 DD DD D D 0 0 D 0 0 D 0 DD D D 0 U 
file operati ons | H [ [| ם‎ DD Dm 2.2 ה |[ ה ה‎ [] [| Ú block devi ce operati ons[] 
םםםםםםםםםם‎ Mœ NMW D D D D D M CR NO) D D [nx 22000000 
U D D D 0 U 


struct file operations device fops = + 
open : device open, 
release : device rel ease, 
read : block read, 
wite : block write, 
ioctl : device ioctl, 
fsync : block fsync, 


EJ 





L 
U U U U 
regi ster bl kde] MAN DMC: NAME, &device fops[] ; 
በ linx 2.400 


U U 000 U 
# nel ude Hi nux/ H kpg. h> 


struct block device operations device fops = + 
open : device open, 
release : device release, 
ioctl : device ioctl, 
bi 
ut 
register blkdev] Mj CR NR DEM CE NME &devi ce fops[] ; 
020000000000 
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OOO00000000000"O0000”000000000000000 2 
U U U U 0 0 0000 0000 U 
U U U D 0 U 
void device request[] void] ; 
U U U U 
Hk del MJ NA. request fn = Saevi ce request; 
םםםםםםםםם‎ 
void device request[] voi d 
{ 
wile 1| + 

INT RHTEST; 












































swtch D ARRENE nd] + 
case READ : 
// read 
break; 
case WATE : 
// wite 
break; 
default : 
end request[] (f] ; 
conti nue; 


) 


end request] 11] ; 
} 
} 
0 linux 2.400 


000000 
int device nake request] request queue t * int rw struct buffer head *5ከክ[] ; 


U U U 
blk queue make request] BLK DEFAULT (፲፲1፲1] Mj CR NH] , &devi ce nake request] ; 


םםםםםםםםם 
int device nake request] request queue t *q int rw struct buffer head *sbh]‏ 





bdata = bh knap] sbh]] ; 


swtch[]rw] + 
case READ: 
// read 
break; 
case READA : 
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// read ahead 


default : 
goto fail; 
T 


ret =1; 


fail: 
sbh- > end id] sbh, ret[] ; 
return 0; 


} 
OO request queue t D D D D D D D D 0 0 0 0 bh nani D D D D 0 0 0 0 0 D U 
APO D D 0 00 U 


Domm נא םםיםםםםיםםםםםםםםםםםםםםםםםםהםההה+‎ 
0000000000000 Dms 2.20 00 D 0 D 0 DDD D D D D 0 Hmx2 4 
DOO00000000000000000000000000 OD 00 DD 0000 U 
U U U U U 
010000000 
U DD DD 000 DDD idQ D D id] 0 0 VRID] LPM GR LU [| Linux 2 


U D D D 0 0 D 0000 U 
struct pci dev *pdev = NIL 


























while | D pdev = pci find device] WNR ID BVC ID ev | !=NIM + 
// initialize each device 
} 
ה‎ linux 2.49 [J 
000000 
struct pci device id device pci tbl[]  initdata = 1 
1 VENXR ID 1፲ላ1(፲ ID PJ AN ID PJ AN ID}, 
100 O, 0}, 





L 


int device init ond] struct pci dev “dev, const struct pci device id *ent[] ; 
void device renove one[] struct pci dev *pdev[] ; 


struct pci driver device driver = 1 


nane : DEM CE NM, 

idtable: device pci tbl, 

probe : device init one, 
renove : devi ce renove one, 
suspend : devi ce suspend, 
resune : devi ce resune, 
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U U U U 
if [] pci register driver] Sdevice driver] =O] 
return - ENTIEV 
U U U U 
pci unregi ster dri ver[] Saevi ce driver] ; 


ዝብ ገ 1 በ በ]በበ በ በበበበበበበበበበበበበበ[ቭ 


Eeg DO [| ሀ O bottom +[ NN D] ሀ [ [ሀ [| ሀ 0 softirq] | ets 


DOO0O00000000006nx22000000006nmx24000000 
בםםםםםםם‎ task&{ 0000 S~MOOOOOOOOOOOOOOOOOOOOO 
OO መ[ሸበበበበበበበበበ ቋመበበበበበበበበበበበበበበበበበበ[በበ[[;በ 
taske D UD [| take 00000 GUD 0 D UD D D CUI OOOOO OD task et[| 
U D D በ በ bO D D 0 DD DD 0 0 0 DDD SED 0 0 00 D GUD 0 D 00000 0 U 
U D D D 0 00 DD D D U D D D D ጠ በ tasket D በ በበ UD D D D D [ በ በ task et 
םםםםםםםםםםםם‎ 35600 


70 U 0 D 000 U 


010000000 

nx 220 0000000000000000 Dm 2200000000 
םםםםםםםםם‎ änx 2.40000000000000 000 

O ind ude/linux/list.h[][] [| [] [] [| list head [] [| 

struct 115% ከ680 + 

struct list head *next, *prev; 
bi 
U U D 000000000000000 0 D 0 0 U 
struct foo list + 
int data; 
struct list_head list; 

bi 
0000000000000 
UST HAD] foo list head]; 
U U U 
struct list head foo list head = 1151 HEAD INT] data list head] ; 
0000 
struct list head foo list head: 
INT LIST HAN] Soo list head]; 
D DDD 0 DDD list ad)00000000000 list del 00000000 

struct foo list data; 

list add] Gata list, Soo list head] ; 

list del] Mata list]; 
QO list for each()Q list entryO 1 [1 [] D Ú 

struct 115% ከ681 *head, *curr; 
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struct foo list *el enent; 


head = &oo list head; 
curr = head- >next; 


list_for_each] curr, head] 
elenent =list entry] curr, struct foo list, list]; 

0200000 

nx 2200000000000 00000 Dom 2.4000000000000 
U D U 
ה‎ Linux 2.200 
בםםםםםםם‎ 
struct wit queue “wg = NIL; 
םםםםםםם‎ 
interrupti ble sleep on] ጩባ] ; 
wake up 1 nterrupti Hell 641] ; 
U inx2.400000000000000000000000000 
U D Bt 
DECLARE WIT QE FAQ] ነባ] ; 


0000 
vait queue head t wy; 
init vaitqueue head] Sf] ; 








10.5 000000 


םםםםםםםםםםםםםםםםםםם םבםםםםםםםםםםםםם 
U U U U U U D 0 0 0 D U 0 0000000 U DU 0 U DU D U 0 U DU 00 U‏ 
በገ በ በ U D 0 0 0 D U 0 0000000 U DU 0 U DU D U 0 U DU 00 U‏ 
በገ በ በ U D 0 0 0 D U 0 0000000 U DU 0 U D U D U 0 U DU 00 U‏ 
D 000 DDD D D Hna 2.2]‏ 2.0000 םםםםםםםםםםםםםםםםםהם 
N0000 22000000000000 2.40 00000 DD DD 00000 DD 0 U‏ 
U U U 0 U U‏ 
Dm J0000000000000000000000000000000000‏ 
U U U በ በ U D 0 0 0 0 U 00000000 U D በሀ D UU 000 0 U‏ 













































































10.5.1 DUDU 00000 U 


OO0O000000000000000 100 int røde] 0 D D D D D 0 0 0 0 U 
0000 200 cleanup ו‎ 0 D D D 0 0 D D D D 0 0 int mdu eù DD D 0 Ú 
U D D 00000 DD DD 0 D 0 DDD cleanup መጩ6[ D D D D D D በ init nodule 
U U U 0 U U 
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U D D D DDD" Hilo, world] "D 
/ * hello.c 
* "Fillo, world"  */ 














*םםםםםםםםם\ 


#nclude dinux/kernel.h> /*00000000000 * 
#nclude tinux/nodude.h> הההההה*/‎ */ 


/* በ በ OMI G MDVERSIONS */ 
፳፲ ONI G MWERI NA 
#defi ne MDVERSI (N5 

# ncl ude di nux/ nodversi ons. h> 
Hendi f 


/*00 000 * 
int init nodule] 0 
{ 


printk] "Fello, world - this is a sinple nodd Ån" ; 


/* 0000000 O00000 int መጪጩፀበበበበበበበበበበበበሣ 


return 0; 


} 

/* QQ init nodul e DD D 0 V 
void cleanup nodul e] [] 

1 


printk] "the nodule exits the kernel \n"[ ; 


10.5.2 QO000 Mkefiles[] [| 


በገ U D U D 0 0 0 D 0 0 0 0000 U DU 0 U DU D U 0 U D 0 0 00 0 00 U 


U DUDU U‏ 000000 בםםםםם>- םםםםםםםם 
--O000000000000000000000‏ אתא 
U U U U U‏ 
MOE -- D D D D D D 0 0 00 DD DD 000000 DD 0 U‏ 
D'U በበበ በ በ በ በበበበበበበበበበበ0[ቨ[ ሀቨ‏ -אאם 
O0O00000000000000000000000000000‏ 
OOO00000000000000‏ 







































































U U U D 11] 1 [| [| [] inusr/inelude/li nux/ confi g. h[] [] [] O 




















U U U U 0 U D 000 U 
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U U U U D U D 0 U 


U U U D U 
U uu 





[] 
0 


U U U U D U D 0 0 0 D 0 0 0 00 DU U D 0 0 U D U 0 0 0 000 U U 0 0 U D U 





SM -- בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהה‎ 


UD 


U U U 











0000 GU O000000000000000000000000000000000 





OMG MDVERSIONS -- D 1] GNIGMDARIOS D D 0 0 0 D D D D D 0 0 UD 
U D D 0 D DD D D D [በ ur/indude/linu/nedversions.h[] 0000000000000 
Mkefile[] |] 


LL erc 
MIXHAGS:--Vll -MOIE -D KERNL -OINK 
































hello.o: hello. ር /usr/i ncl ude/li nux/ versi on. ከ 
$] GI $] MIXHAS] ס-‎ 06 
echo insnod hello.o to turnit on 
echo rnmod hello to turn it off 
echo 


በ D 000 בםםםםםםםםםםםםםםםםםםםםםםםה הא‎ hello. o] 
በ D | insnod] hello] D በ በ በ በበ በ በ በ rnmodQ OG ה‎ DD na 00 D D 0 U 
DU D D D D 00 D 0 D סה‎ es D D D 0 D D 0 D D D 0 D 0 0 0 0 0 


10.5.3 IDO0000000 


OO0O00000000000000000000000000000000000 
םםם םםםםםםםםםםםםםםםםםםםםםםגהם‎ #efine NOVERSION 
OO 00000000 mdu e. hf] [ [] [] [] [| kernel version] [| D] [kernel versi on 
O00000000000000000000000000000 version H] 
םםםםםםםםםםםםהם‎ N VSO በ mdu e. hD 00000000 
02 00000000000000 
LU 
m 
LU 


2860000000 םםםםםםםםםםםםםםםםםםהם 
elf 1386 -r -o «nane of nodulex o 4] 10 000 >o 4 20000>0‏ 


[] ODO start. d 

















* "1110, world" 
*QDOO00000000 
*/ 


* םםםםםםםםם\ 


ሥ”ሥገበ]በበበበበበ” 
#nclude di nux/ kernel . ከ> 
i ncl ude di nux/ nodul e. h> 


/* በ በ ONIG MWERI ONS */ 
፳፲ (MTG MWERI NA 
#defi ne MOMERSI ONS 

# ncl ude di nux/ nodversi ons. h> 
Hendi f 

/* 00000 v 

int init nodul el] [] 

1 
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printk] "Hello, world - this is the kernel speaking n"[] ; 














return 0; 


} 
U U U DD stop d] 


/* stop.c */ 
/* 00000000 stop 000 */ 


/ፆበበበበበ0” 
i ncl ude <i nux/ kernel . h> 


#define ND VERSION ` 
i ncl ude <i nux/ nodul e. h> 
81001 ude di nux/ version h> 


፳፲ COG MWERI NA 
#defi ne MDVERS ONS 

få ncl ude <i nux/ nodversi ons. h> 
Hendi f 


void cleanup nodul e] [] 
1 


[211118] "Short is the life of a kernel nodd An"[] ; 


00000000 Mkefile] 
LL erc 
MOLAS :=-VWAl -IMHIE-D KERNL -OINK 


hello.o: start 0 stop.o 
ld -melf 1306 -r -o hello. o start. 0 stop. o 


start. o start.c /usr/incl ude/ li nux/ versi on. h 


$] GI $0 MAAN] ס-‎ 0 


stop. o: stop. ር /usr/incl ude/ 1 i nux/ versi on. ከ 
$ GI $] MAANI -c stop. c 
“hello” በበበበበበበበበበበበ 464) 0 DDD DDD DD 00000 DDD 0 N0 
D D D DDD D D DD D D D" "ונא‎ D በ D በ mad D DDD 0 D DD 0 D D 0 0 
U DDD DU 0000 D 0 D D 0 0.000 በ U 
U DUD DU | በ በ በ በ በ በበ በበ በ D 0 0 00 D D በ ሀ U 
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11111 OO0000 


OOO00000000000000000/000000000000000000 
O0O0000000000000000000000000000000000000 
OO0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
בםםםםםםטםםםםםםםםםםםםם‎ EnxJQ00000000000000 
U U 


הח 11.1 


og ime םבםםםםםהם/םהה‎ 30000000000000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםםםם םםםםםםםםבםםםהם‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
OOO000000000000000000000000000/dev/cua0] /dev cual[] 0 
OO0000000000000000000000000000000000 5120 1024 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ መበ 
U U 













































































U U 
DO 
U U 
U U 











[] 
[] 
[] 
0 
U U U 0 U 0000 DU 0 U UU 00000 D 0 0 U 0 
brdevs] D 0 D D D 0 D 0 0 D D D D 0 0 0 D D D D DUU iod D 0 [J 


Dot‏ םםםםםםםםםםםםםםםםםםםםםםםםםםם 
U U 0 U D 000 U‏ 























eo Pa T EI 
= 
o 
ES 
E 
o 

















11. 1.1 1/000 


I/O1000000000000000000000000000000000000 
OO000000000000000000000000000000 70000000 
OOOOOO0O000000000000000000000000000000000 
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(383ብ D D D 0 D D 0 0 U 
םםםםםםםםםםםםםםםםםם/םם‎ 11.1000 
םםםםםםםםםםםםםםםםםםםםםםםם‎ Umeg םםםםםםםםםם‎ 

OOO00000000000000000000000000000000/000000 

O000000000000000000 4.2000 



















ና (በ000. T 
É א‎ 
Ë IL 
[1000055 ]- 

U D U - 

םםםםםם 

FE 

C n 


O 111 00/0000000000000000 


םםםםםםםםםם 
U‏ 
uu‏ 


口 


D UO 0 0 0 0 0 DU vo 








CJ 


םםםםםםםםםםםםם 











口 


בםםםםםםםםםםם 


U UO 0 0 000000000 0 








00 ፻0[ D 


U 
U 
U 112 000000000 
U U U U 000 0000 00 (U 
e UU DU 0000 U D 0 00 NON D 0 0 0 D 0 0 0 0 0 U D 0 U D D 0 U DU ከ 


U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UD U U በበበ D 0 0 0 0 U 0 00000000 000 U 
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e J0000000000000000000rQ00 

e U UU UU UU DUDUDU 0 0 D U 00 0 0 DU 0 0 D U 0 0 0 00 0 ሀሀ D U 
U U U በ በ U D 0 0 0 D U 00 U 

e U UU UU UU DUDUDU 0 U DU D D D U D 0 00 D U 0 0 D U D 0 0 0 D U 
DU uut 

e J000000000000000000 

e U UU UU UU UU 0 UD U 0 U DUDU 000 U 




























































































11.1.2 Dn Dnm 


መሚመበበበበበበበበበበበበበበበበበበበበበበበበ[በበበበበበ[በበ[ሀ[በ 
בםםםםםםם‎ VO NONONO NEN DO NO 10000 Sas00000 SSI 
OO000000000000000000000000GRIQOOOOOOOD Adaptec 
2940 SA ה‎ 0 D D GRO NR 810 SS D D 0 D D D D D D D 0000 DDD DD 0 0 0 












































































































































ዉጩመበቨሀበበበበበበ በበ በበበ U‏ בםםםםםםםםםםםםםםם 
በበ U U D 000 00000 D 00 በበበ በሀ D 00 U 0 D 00 U 0 00 0 DO‏ 
Unx በ በ] በ 1 በ በ D 000000 0000 000000 0 00 D 000 00 00 U‏ 
U U U DU U D 0 0 0 D U‏ 
U U U U D U D 0 0 0 D 0 0 00000 000 0 U DU 0 0 0 000 0 00 0 00 U‏ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
OOO0000000000000000000 IEED D D D በ 0 /መ/ከጩ]‏ 
1330000000000 םםםםםםםםםםםםםםםםםםםםםםםםם 
פםםםםםםםםםםםם 
0000 
0000 
000000 
00000 
0000 








םםםםםםםםםםםםם 11.3 0 


U U U U D U D 0 0 0 D 0 0 0 00 DU U D U 0 U D U 0 0 0 000 00 0 0 U UD 
U U U UD U U D 0 0 0 በበበ 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
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U U 0 U D 0000000 U 
OOO000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
U U U 


U DDD DDD DDD DDD D 0 D D 
OO0000000000000000000000000000000/0000 
O000000000000000000000000000000000/000000 
000000000 

DH n 11111000000በ0ሸ፡ 

« I00000000 

e I000000000000 

e I000000000000000 

e I0000000000 

e I000000000000 
በ inxsJ000000000000000000000000000000000 
O000000000000000000000000000000000000000 
O000000000000000000000000000000000000000 
O00000000000000000000000M000000000000000 
OO00000000000000000000000000000000000000 
file operations] D II 0 D 0 0 D 0 D 0 0 0 0 D DDD 0 0 D 0 D D file operation 
O00000000000000000000000000 Nur 

Dn QQO00000000000000000000000000000000 


םםםםםםםםםםת 


U U U U D U D 0 0 0 D 0 0 0 0 0 DU U D 0 0 U D U 0 0 0 000000 0 U UD 
DOO0000000000000000000000000000000000000 


2J0000000000 


Hm JO00000000000000000000000‏ םםםםםםםםם 
OO Dm [00000000 70000‏ 


D000000000000000000000 
በገ] በበ U D 0 0 U D 0 0 00000000 00 D U 0 00 U ሀ ሀቨ 
4900000 


OO ገፈመጪመኤልበበገበበበበበበበበበበበበበበበበበበበበበበ[በ[በበ[[;[ 
U U BE BJA EHNA EOD 
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TOO 


Dm J0000000000000000000000000000000000 
U U U 0 0 U 


11.2 D [] [] [] [| 


11.21 1/000 


D 0 DD 0 םםםםםםםםםםנסע‎ LOD D D D D 0 DD 1/000 በ 1/0portM 
D 18ቹ00100በበ0001/000000በ0000 63360 800 םםםםםםםהסע‎ 
OO 80000000 16000000000000000000000000000 
በ 160000000 3200000000000 40000000000 40000 
U D D 0 0000 መብ 1/00008000000009 inf ins] out 0 outs] O C] 
D D D DDD D 0 QD D D D D D D D D D 0 0 םםםםםםהםהםםהסע‎ ROO 


E 
51:1. ב‎ E) 


U 
[] 
[] 
0 


םםםםםםםםםםהסע בםםםםםםםםםםםםםםםםםםםםמנסע 
መብ and] r 0 D (D 0 D 0 0000 0 U‏ םםםםםםםםםםםםםםםםםםםםהם 
Oooo UG D 0 0 0 000000 000 0 0 0 DAT) D 0000 U‏ 
1/0000000000000000000000 םםםםםםםםםםםםםהם 
VO D D D D D 000 1.400000000000000 0000‏ בםםםםםםם 
DD D Gntrol Register D D D D በ D D 0 Status Register] OO‏ םם 0 0 0 U D D‏ 
Input Heat ster | D 0 0 Ú‏ םםםםםםםםםםםההטשםםםםםםםםםםם 
Qtpt Register DDD 0 0 0 0 D DDD‏ 0 0000000000000000 
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በ] 1.4 00 1/000 


םםםםםםםםםםםםםםםםםםםםםםםנסע םםםםםםםםםםםהם 
DOO0O00000000000000000000 7/00000000000000000‏ 
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000000 LOD [በ ?injoutQinsq otsQOOOO0000000 1/00 D DU mx 
U U 0 U D 0 0000000000000 U 


19 ink )[] 1መዛ )שגה(‎ )[ [] 


000 100000 1020 400000000" חש‎ wo" סה‎ 8 
U UD 0000 (שהשםםםםםםםםםהא‎ 


Al inb pf )1 inwp )011ጠ p ) 


Ooo 100000 1020 4000000000000" OOO dum) 0 D H UU 
000 ה‎ 


3] outb( )[] outw )[] outl( ) 
00000 םםםנסע‎ 1020 4000000 
ብ] outb pi ( outwp( ን[ outl ሠ ) 


U D DDD 00000 120 4000000000000" 00” 000 (መ 
U U 


5] 1:5 )[] insw )[ insl( ) 


000 םםםםנסע‎ 1020 400000000000000000000000 
U U 0 0000 U 


6 outsb( )[] outsw )[ outsl( ) 


በበበ םםםםנסע‎ 1020 400000000000000 

םםםםםםםנסע [/ዐበበበበበበሀ‏ 1/00000000000000 0000 
םםםםםםםםםםםהסעםםםםםםםםםםםםםםהצ םםםםםםםםם 
0000000000000000000000000000/ 00000000000 
מםםםםםםםה הפשוםםםםםםםםםםםםםםםםםםםםםםםםםםהם 
30000 םםםםםםםםםםםםםםהםהםםנסע D0000‏ 

request region ) 
00000000 םםםםםםנסע‎ 1/0000 
check regi on( ) 


םםמסע 00000000000000000000000/ בםםםםםםםם 


release regi on( ) 
םםםםםםהנסע םםםםםםםםם‎ 1/0000 
00000 10000 LOD D በ በ በ /proc/ioports [1 1 1 DI D D] 
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11.22 1/01 1በ1[1[1[0 1 [ 


1/00000000 םםםםםםםםםםםםםםםםםםםםםםםםםםהסע‎ 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםנסע בםםםם‎ 
םםםםםםםםםםםםםהםםםנסע םםםםםהםםםםםםםםםםםםה‎ IRQ 
U U U U U U D U 0 0 0000000 00 0 U DU D 0 0 UD 0 0 0 000 U 

በገ U 0 UD 000000 U 


10 0 D 1/000 


00000000 םבםםםםםםםםםםםםםםםםםםםםםםםםםםםם 

CD DDD DDD 00 DD 0 U‏ בםםםםםםםםםםםםםםנסע בםםםםםםם 

PONDO DOM DDD 00000 DD DD 0 D 0000 D 0 U‏ םםםםםםם 
OOO00000000 1/0000‏ 


2000 1/000 


በበበበበበበበበበበበበበበበበበበ םםםםםםםםהםםםםהההםנסע‎ 
U D D 00000 DD DD በጃ] POGAU NO 2.2 0 0 0 D D D D 1/00 D በ 
סע םםםםםםםטםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D 0 
U D DU D 00 D DDD 000 DD DD DD 0 0 0 DD D D םםםםםםםםםםםנסע‎ 
םםםםםםםםםםםםםםםםםםםםםם‎ /0000000000 0 
*מםםםםםםםםםםםםיםםםםםםםםםםםםםםםםיםם‎ 
000000” O00000000000000000000000000 
OO0000000000000000000000000000000 መረ 
U Uu 
























































































































































11.23 OOOO 


mx0000000000000000000000000 3‏ םםםםםםםםם 
U U U U U U D U 0 0 0 U 00000 U‏ 


U 0 D 0 D 0 0 ה‎ 0 0 0 0 D 0 D 0 0 0 D 0 
nknod( const char + filenane, int node, dev t dev) 


16 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
dev TL D D D 0 D DDD 8000000000 800000000000000 30‏ 
U D D DD 000 01 MRO] MNRO DUU 1060 D D D 0 00 DD DDD D 0 MEV‏ 
U DD DD 000 DDD 160000000 da LD DDD 00 DDD DD D D 0 0 0‏ 
OOOO kdv t D 00000 H ne 2.40 0 D 0000 DD DD DDD D 0000 U‏ 
meg 0 0 Okdev TL D D 0 0 0 D D D D D D 0 0 0 DDD DOO‏ 000000000 

000 2000000 

















ET EI EXE es T EE 
a E=]: ea ES: El = 








-411- 
































UI Linux [ ul 

















በበበበበበበ0በበ00በ00[0/መሀ[ םה‎ D I I 000 docunentati on/ devi ces. txt 
00000000 include/limux/najor.h סםםםםםםםםםםהםההה‎ 
በበበበ000በ/መበበበበበ 2.100000000000000000000 
U U 0 U D 0 0000000000000 U 







































































0 11.1 םםםםםםם‎ 
OOO OO OOOO OO 00 
/ dev/ f do 000 2 0 U U 
/ dev/hda 000 3 0 0 10 ההיז‎ 
/ dev/ hda2 un 3 2 በ 10 LED D በ0 በ 20000 
/ dev/ hdb un 3 64 በ] 20 IŒ00 
/ dev/ hdb3 U 0 0 3 67 በ 20 LED በ በ በ በ 30000 
/ dev/ ttypO 0000 3 0 10 
/dev/ console |0000 5 1 000 
/ dev/1pi una 6 1 00000 
/ dev/ttyS0 OOOO 4 64 በ 1000 
/ dev/ rtc OOOO 10 135 0000 
/ dev/ null 0000 1 3 U 0 00000 
በገ] DDD 00 D 0 DDD DD DD D / devi dañ 0000 00000000 
U 0 D 00000000000 /dewhda2] NA OO DO 000000000000000 
*םםיםםםםםההוששםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
በገ|[በበበበ በበበ በ] በ በ 1 በበበበበበበበበበበበበገበበበበበ[በ[ U 
OO000000000000000000000000000000000/tmdådsk 




















U uuu 





[] 


10000 /dev/tty OO በ 00000 


םםםםםםםםםםםת 


U U U U D 0 0 U D U 

e 00000 םםםםםםםםםהםםהםנסע‎ 

e 0U00000000000000000000000000000000000 
U U 0 U D 0 0 000000 U 

Q ROM D 000 RAD D 0.0 D D 0 D 0 000 U‏ םםםםםםםםםםםםםםם 
U D D 0 0 RD D 0 0 D 0 0 0 0 D 0 0 D 0 0 D 0 D D D 0 RMD D D 0 0 0 000 U‏ 
U U 0 U D 000 U‏ 

U U U U D U D 000 U 
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ቭበበበበበ O0000000000‏ םבםםםםסטיםיםםםםםםםםם 
/dev hda [I 00 00000000000000000000000000000000‏ 


[] 





U U 


e 000001 
U U U UU U 000 U 





QD ገበ D 00 D DDD 000 D DDD DDD DD 000000 U 
U U 0 U D U 0 00000000 000 U DU 0 U D U 
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በ VO] D [ ቨ 
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U U U U DU U 
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U U 0 U 0 00 0 
U U U 








11.2.4 VFS] 


U U U UU U 000 U 























LOD D D 0 D 0 0 U 








U U 
U U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
OOO00000000000000000VSQ000000000000000000 


OOO000000000000000000000000 
O0O00000000000000000000000 
OO /O00000000000000000000000000000000000 


U U U U D U D 0 0 00 000 U DU 0 U D U 00000 0 DU U 
በገ U D U 0 0 0 0 UD D U D U 0 0 0 0 0 0 0 00 00 0 U D U 


PSO D D D D D םםםםםםםםםםםםםטםםםםםםםהםםםההאש‎ 


በ ሚከ በበበበበበበበበበበበሀበበበበበበበበበበበ[[በ 


OOO000000000000000000000000000000000000 
OOO000000000000000000000000000000000 
socket ( )[] bind( )[] listen( )[] accept ()[] comect( 10 ] 1111100100] D 0 0 [] 


በበ በ፲ םםםםםםםםםםםםםםםםםםהופאאא‎ 


U U U 000 U 


በገ U D U 0 00000000 በበበ 0 U D U D 0 U 


U U U U 0 U D 000 U 



















































































OO0000000000000000000 םםםםםםםהסע‎ 


U U U 0 U U 
11.25 OOOO 
םםםםםם‎ GY OO000000000000000000000000000 
DU D D D D 0 GOD NON PONDO 0 0 D 0 D D D 0 D D 0 D 0u 0000 
OOO000000000000000000 /0000000 GUO D 00 םח‎ 
םםםםםםם‎ GUD D D 0 0 0 00 DD DD 00000 DD 0 U 
םםםםםםםםםםםםיםםםםםםםםםםםם‎ 20 00 "0 DD 0000 U 
OOO0000000000000000000000000000 
O0O00000000000000000000000000000000000 
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በበበ] ND DD NDN U DU U D U 0 0 0 UD 0 0 00 0 0 0 0 D 0 O 
DOO0000000000000000000000000000000000000 
OOO0000000000000000000000000000000000000 
O0O000000000000000000000 

O0000000000000000000000000 GUD 00000000 
U U 0 U 0 0 0 0 U 0 O00000000000000000000000000000 
U U 0 U D DD NONONO ND U D U 0 0 0 U 00 0 00 0 0 0 0 D 0 0 U D U 
פםםםםםםםםםםםםםם‎ 
































םםםםהה אתם 19 


Dm J0000000000000000000000000000000000 
בםםםםםםםםםםםםםםםםםםםםםםםםם‎ reqest_irq( ) O00000 
םםםםםםם‎ ፤፣ዌ-[!ዉበበበበበበበበበበበ 0 D D D 0 0 0 0 D D 00 D 0 00 U 
U U 

request 1፲79( IO D 0000 0 


int request irq( unsigned int irq !* םםםםם‎ > 

void (*handl er) (int, void *, struct pt regs *),/* [00000000 * 
unsi 0060 1 ong iraflags, !* O0O00 * 
const char + devnane, /* D0000 ሣ 


void “dev id H 
OOO irgacttionG 000000000000 15000 
struct irqaction { 
void (*handler)(int, void *, struct pt_regs *); 
unsi gned long flags; 
unsi gned | ong nask; 
const char *nane; 
voi d *dev id; 
struct irqaction *next; 
L 
static struct 1፲08ር11 מס‎ *irq acti ]תס‎ NR IK54] 
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Irq_action Irgaction Irgaction 


han dler han dler 
flags flags 
mask mask 


name name 
dev_id dev_id 
next next 






Irqaction 


handler 
flags 
mask 


name 
0 dev_id 
next 


irgection[] [1 H [] Ú‏ 11.5 ה 


U U DU 0 000 D 0000 irqacim םםםםםםםםםםםםםםםםההה‎ 
פםםםםםםםםםםםם‎ 
OOOO בםםםםא‎ O00000000000000000000000000 
00 GOO0000000000000000000000 א‎ DD 000000 U 
OOO000000000000000000000001SA9Q00000000 
OO0UmeQ000000000000000000000000 
00000000 1ላበበ[በበ[ሀበ[በበበበበበበ[በበ[በበ0000 ה‎ 





o9 
o 

















D IROD 
OO RIO0000 14ላበበ80በ[8ሀ0008001[000000000000000 
םםםםםםםםםםםםם‎ PA QO000000000 ra DD DD 0000 U 
PA NN PO BO] םםםםםםםםםםםםםםםםםםםםםטםהההה א‎ 
OO םםםםםםםםהא‎ 
בםםםםםםםם‎ b DD 000 DDD D I-I DDD DDD DD 0000 U 
O000000000000000000P0Q0000000000000000 
םםהההאתעטםםםםםםה א םםםםםםם‎ 10000000000000 
םםםםםםםםםםםהההמטאשו בםםםםםםנםם‎ irgctionr D 0 D U 
1.500000000000 Hn D DD DD 000 DD DD DD 0000 U 


20 bmx I DU 0 0 U 
DH me I 0 0 0 በበበ በ 000 D 0 00000 D 0 000 D 00 00 000 DD 
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O000000000000000000000000000000 60000000 
OOO000000000000000000000000000000000000 
U U 



































U U 0 0 0 U D me 0 0 0 0 D 0 0 0 0 D D 000 0 0 D 0 0 0 0 0 00 00 000 U 
U D DDD פוא‎ DDD 0000 DD DD 000 DDD D 60000000000 
U irq הסג‎ OOOO 70000000000000000000 

U ime בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםההה‎ 
OOO0000000000000000000000000000 
O0OO0O0000/0000000000000000000000000000 








םםםםםוםםםםםםםם 

U D D D D DD read) OOO request) OOO000000/000000 
U U 0 U D 0000000000000 U 

U U U OOO00000000000000000000000000000 
U U U U U 0 U D 00 0000000 0 0 U DU00000000 000 U 
U U U םםםםםם‎ 0 0 በ] read) OOO 0 םה‎ D D D 0 D 0 0 DI 
O 5) DDD [ በ በ በ በ በ reg 90 ה‎ D 0 00 DD D D 0 0 0 D 0 0 U 

U U 0 U D 00 00000000 00 0 U DU 0 U D U DU 00 0 U 


























11.26 00 DA] [] 


ooo בםםםםםםםםםםםםםםםםא‎ MCO DDD DDD DD 0000 U 
D RAM] I/O D 0 D D D 0 0 [ 0 הברא‎ GOD D 0 0 0 D 0 0 D 0 0 0 00 0 0 U 
U D D 0 D 0 הא‎ 0 D 0 D 0 0 D D D መቁ DCD D D D D D D 0 0 000 DD 0 U 
U U U UD U U D 0 0 0 0 000000 000 U 
OO DACD D D D D 0 0000 DDD D 00000 DD D D 000 mcg 
נבםםםםםםםםםםםםםםםםםםםםםםםם‎ EO D 00 0 
000 14ላበ010100[00000 MO DOO DON DON DN D הק הנא‎ 
U D D DD 0 MgO00000000000D000000000000000000 











30000000000000000000000000 םםםםםםםםםםםם 
በ መገበ ገገ D 0 0 0 0 QU D'O D DDD 000 0 0000000000000 4‏ 
QD 000000000000000000000‏ בםםםםםםםםםםםםםםם 
POON DD DD DD 00 DDD 0000 DD DD 0 0 0 በ በ በ በ በ Sm SPARC‏ 
Gnpeq(] N pha] 0 0 D 0 D D 0 0 0 0 D D 0 0 0‏ 0 

U 0 D 0 DUD D 00 DD DD 0 D 0 0 D 0 DD 0 00 0 DAD በ 0 0 0 0 D 0 መ 
00001/0000 הא‎ 000000000000000 DAT D 0 DO 00 DD 0 
םםםםםםםםםםםםם‎ DOUD LO D 0 0 D 1000000 1/0ቨ0 በ DÚ 
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OO /000000000000000000MO000000000M0000 
በ 1/00000000000000000000000000000000000000 
OOO MO D 0 በበ D D D DD Nod 0 D 0 IRI GUD D D 0 D 
0000000000 1/0100[0 םםםםםםםםםםםםהםםהםהההנההאת‎ 
םםםםםםםםםם‎ virt to bis bus to םםםםםםםםםםםםםםהההחט‎ 
U U U DD U D 00 0 D U 
በ הז‎ D DIMO D 0 0 0 0 00 D D D D D D 0 D 0 0 D D DD 00000 DD 0 U 
U U 0 D U 0000 DAD 0 0 0000000000 U 


1] ISA 00 DA 


OO םםםםםםםםםםםםםםםםםםםםםםםםםםםהםהההאתו‎ 
DACD D D 0 0 0 D D 0 D DD 00 0 
םםםםםםםםםםםםםםםםםםםםם‎ SAMT D D 0 DD D D 0000 0 
U U U U D U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 ሀቨ 
010000000 open )OOOOOOOOOOOOO i0000000 O000 
U U U U 0 U D 000 U 

e OO request irg )[ 0 0 ISADMCO D D 0 191000 

° OO request dna( )[ 0 0 DAD [ TE 

e םםםםםםםםםם‎ M0000000 

« 000000 MOON 0000 

02000000 DAD D 0 DD D D D D 0 reed] DD wit] DD DD DD 0 0 0 DD 

° OO set dna node 10 D D 0000/0000 

e DO set da addr( 70 0 0 DAD 00 DD D D D UD D D D 0 D 00 40000 
OO DAD D 0 0 0 D D D D RD D 16M] [T] 

e OO se dna count( 10 D D 0 0 D 0 0 0 0 U 

° OO set dna da )[ [ D DAD [ U 

- הא נבםםםםםםםםםםםםםםםםםםםםהםם‎ DDD DD 0000 U 
OO 1/00000000000000000000000000000000 

e 0000000000000 disable de 10 0000 DAD DO 

° DO get dna reide( JIN D D D D 0 0 0 D D D D D 0 0 

03000000 release] ה‎ 0 D DD D D 0 D 00 DDD DD D D 00 OOOO 
U U U U U 

« OO מםםםםםםםםםםההההא‎ 

s OO free da( )[ [ በ DAD [ T 

e OO free ir )D D DAD D 00 IRO D 


20 DO D D D DA 


PA D D D D DAD D D D 000 DD DD MOOD TON 00 0 0 D open) 
םםםםםםםםםםםהההא 180000 םםםםםםםםםםםםםםםםםהם‎ 
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OOOO MOON D 0 0 0 0 D 0 0 0 00 OD DD 000 0 0 0 U DAD 00 L 
0000000000000 LOD D 0 D 0000 DAD 0000000000000 0 
OOO0000000000000000000000000000000000 release 
םנמאו םםםםםםםם‎ 















































11.2.7 I/OJUD U DÚ 


OOO0000000000000000 םםםםםםםםהםםםםההםהנסע‎ 
በ MO BAT DD D 0 0 0 0 D 0 0 0 0 0000000000 L 


100000 
00000000000000 1000000 30000000000 


OO ISAOOOOOOOOO 
በ D D D D D 080000 Oxfffff II 0 D D 0 D በሀ ሀ በ ear 1MBUD 
בי"םיםםםםםםם‎ 
0200000 בצ‎ D D 0 0 WBT D D D 0 0 L 
D D DD DD DDD DDD 00 DDD D U OD I 0 D D በ Oxe000000 Oxffffff በ 
U D D D D 0 00 D 1460 16890 D D D D D D D 0 D 00 DD DD 0 D 0000 D 0 U 
מםםםםםםםם‎ 
032000000 םםםםםא‎ 
LU OD D 0 0 000 D DDD 00 DDD D D RMD DD 0000 DD DD 0000 U 
U U U U 


2000 1/000 


PONDO DON DD 0000 U‏ םםםםםםםםהסע םבםםםםםםם 
U U U U U U D 0 0 U D 0 000000000 U‏ 
OOO0000000000000000 LOD D 0 D D 000 0 0 D PAGE CBE]‏ 
U D DU DDD DDD [0 [0 DD PAE OFSETO O @xc000000M] D D D D D 0 D D U‏ 
OOO 44‏ 
ROO‏ םםםםםםםםםםםםםםםםםםםםםםםסע םםםםםםםםם 

םםםםםםםםםםםםם D D‏ 0 3220000000 םםםםםםם 
U D D 0 D 000 DD Ox00b0fe4 LO) 000000 110 0000000 Oxfcooooo0‏ 

[] 


በበበበበ t+t2000000000000000000000 
1 =*((unsi 00660 char +) ( OxcOObOf e4) ) ; 
2 = *( (unsi gned char +) (Oxf c000000) ( ; 


RAND D D 0 00 0 0 U‏ םםםםםםםםםםםםםםםםםםםםםםםםהם 
U D D UD 4B000000000000000000 1000000000 0xc00b0f e4‏ 
ISAD” D 00‏ “00 א በ በ ቨ 0x000bfe4 0 D በ በ በ 640K0‏ מסע U D D‏ 







































































U U U 
[] 
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[] 

0 200000000000000000 1000000000 RM 
U D D DDD በበበ በ 0 D D I d H በ በ በ oxreooooon n D BD. UO D 

[] 

U 





0000000000 7000000000000000000000 
በ] D iorenap( )[] D D በ 0 በ iorenap( )[] vnalloc( ה ה(‎ 00000 





O0 get vmarea( ) 000000 vmstrut D 0 0 0 0 D 0 D D D D 0 0 D D 0 D IO 








U D D D D 0 0 iorenap( 10 0000 D D D D 0 0 0 00 D D 0 U 


በበበ 2000000000000 
io nem i orenap( Oxfb000000, 0x200000) ; 
t2 =*((unsi gned char *) (io nem + 0x100000) ) ; 


10000000 28000000000 םס‎ D 0 20000000 























06000000 D 0 D D D D D D 0 0 D 0 0 D D D D 0 0 0 D D D D 1ጩጩቹ JO OD 


[] 


םםםםםהסע םםםםםםםםםםםםםםםם םםםםםםםםם 


06000000 D D D D D 0 0 0 0 0 D D D D 0 D 0 0 0 0 D D D 0 0 0 D D D D D D U m 


U U U 





םםמסע םםםםםםםםםם 
readb, readw read‏ 


OOOO 1/0000000 10200 40000 


witeb, witew witel 


40000 0200 םםםםםנסע 0000 


nencpy fromo, nencpy toio 

በበበበበበበበ / ህበ በበበበበበበበበበበበበበበበበበ[በበበበ[በበ በበ 
םםםםנסע םםםםםםםםםם‎ 

nenset io 
םםםםםםםםםם‎ 000000 


O 04600000 חס‎ 0000000000000 
io nem= i orenap( Oxfb000000, 0x200000) ; 
t2 = reod o nem + 0x100000) ; 


םםםםםםםםםנסע 0000000000000000 




















11.28 OOOOOOOGO 


[] 
U U U 
U U U 
U U U 
U U U 
U U U 





U D D D 0 0 D D 0 D 0 0 0 0 D DD 0 0 D D D D D D D D D 0 D 0 D D 00 0 U 
OOOO0000000000000000000000000000000000 
U U 0 D 0 0 0 0 DD 00 D D D D D 0 D D DD 0 0 D 0 D 0 D 0 D D D 0 D 0 U 
OOOO םה הצא‎ M/ØXKQQ0000000000000000000000 
00 [] Device Iri ver Interface] Iri ver- Kernel Interface) 000000000 
U U 0 D 00 0 0 DD D 00 U 


DH nm 0 DD D D D D D 0 DD D 0 D םםםםהםםהםההםההאע‎ 3000 
በበበ በ DD DD 000 DD DD D D በ 0 file םה‎ 

U 20 D 0 0 0 00 DU00000000 DD 00000 D 00000 0 U 
םםםםםםםםםםםםםםםםםםםםםםםםטםםםםםםםםםםםשם‎ 
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ut Linux | [1] | 

U U 0 D 0 U 

U D DD 0 0 D 0 D 000 D 0000 D 00 0 0 U 

01000000000000 

020000000000 

D30000000000 

םםםםםםםםאם 

םםםםםםםםהםםהםם 

በገ [በበበበበበገበገገ ገ 0000000000 000000000000000 
D0000000000000000 ioco ut 0 UD D D D D በ በ በ በ በ cdrom 
ioctl()[] 

OOO000000io0t1000000000000000000000000000 


በ floppy ioct1 OL] 0000000 

static int floppy ioctl(struct inode *inode, struct file *filp, 

unsigned int cnd, unsigned long param 

OO መበ በ  በበበበበበበ[በበ በ በ HR RTD D [በ በ በ 0 D 

D iotlOOOOOOO0000000000000 15691 O00 

U U D 0 D 0 0 D D 0 D 0 D 0 D D 0 D 0 D 0 D D 0 0 0 0 0 0 D D D D 0 D 0 0 U 
U U D D D 0 0 0 0 0 D D D D 0 D 0 D D 0 D 0 D D 0 D D U 

U U D 0 D በ 0000000000000 


1.3 DOOOOOO 


GUD DD no‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
U U U በበበ በበበ D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
U U U UD U U በበበ D U 0 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U‏ 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U‏ 
U U U‏ 


םםםםםםםםתם 113.1 


U U U 0 00 0 0 U DU DU D 0 U D 0 D 0 D D 0 0 U D ገበ 0 0 0 U D 0 0 D 0 (U 
U D D DD D D register א‎ ) 00000000000000 Hkdevs[] በ 
OOOO fs/bock dev. c U 0000 


static struct 1 

const char *nane; 

struct block device operations *bdops; 
} bl kdevs[ MX HLKLEV; 


በ] lime 2400 00000000000000000000000000000N 
OOO000000000000000000000000000 file operations] N O 
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D D በ በ በ በ] [| block device operations] 0000000 
struct block device operations + 

int (*open) (struct inode *, struct file *(; 
int (*release) (struct inode *, struct file *); 
int (*ioctl) (struct inode *, struct file *, unsigned, unsigned long); 
int (check nedia change) (kdev t); 
int (*revalidate) (kdev t); 
struct nodule *owner; 



































bi 
OOO file operation] DD 0 D 0 DD YS DD 0 D DDD DD DD 0000 0 
00000000 block device operations] DD 0 D DD ] D D] 0 D 0 D D 0 D D 0 0 
U U D D D U 
U U D D 0 0 D D 0 D NON DN DD D 0 DD D 0 DD 0 D DD 0 D 0 0 0 0 U 
block devi ce operations] ] 0 00 
D 0 በበ በ register_blkdev] 0 D 0 0 D D 0 D D DD D fs/block dev. c [] [ 
int register bl evt unsigned int najor, const char * nane, struct block device operati ons 
{ 











if (najor ==0( + 
for (naj or = MX HKEV1; major > 0; najor--) í 
if (bl kdevs[ naj or]. bdops = NIL) í 
bl kdevs[ naj or]. nane = nane; 
bl kdevs[ naj or]. bdops = bdops; 
return naj or; 
} 
T 
return - EH EY; 
} 
if (major >= MX H KIEV) 
return -E NAL 
if (bl kdevs[ naj or]. bdops && bl kdevs[ naj or]. bdops ! = bdops) 
return - FBLBY; 
bl kdevs[ naj or]. nane = nane; 
hi kdevs[ naj or]. bdops = bdops; 


return 0; 

} 

300000 200000000000000 10000000000 םםםםםם 
נש GOO0000000000000000‏ םבםםםםםםםהםםםםםםםםםםםם 
םםםםםםםםםםםםםםםםםםםםהםםםםםםםםםםםםם 

D00000000000000000000000000000000000000 
םםם םםםםםםםםםםם‎ file ב‎ 

U D DD DDD file operations] 00000000 fs/block dev. c [] በ 



























































struct file operations def blk fops = + 
open: bl kdev_open, 
rel ease: bl kdev cl ose, 
11 seek: bl ock 11 seek, 
read: generic file read, 
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wite: generic file wite, 
nmap: generic 1116 nmap, 
fsync: block fsync, 

ioctl: bl kdev ioctl, 


L 
OOO םםםםםםםםםםםםםםםםםםםםםםםםהנםםםהההה(פ‎ 
םםםםםםםםםםםםםםםםםם‎ oeg DOD 00 DD D 00 D 116000 





open() 0000000 
sys open() 
filp_open() QQ /fs/open.c [ | 


dentry_open() 





blkdev_open() D [] fs/block_dev.c[] 


በ 116 OO open] D DU 


OO 14.6000000 open 00000000000000 def bk ያጩ | 
blkdev open] J D O0 O bl kdev open] ה ה ה‎ D D D 0000000000000 
block device operati ons JO [| [] [] [| [] [] block devi ce operations | 1]111[ 1 [| D 
open U 00000000 ጩመመበበበበበበበበበበገገበበበበበበበበበበበበበ; 
U D DD 0 0 D DD 00 DD DD D D D D 0 D D D DD D D D 0 D 0 D D D D 00 0 U 

ገበ IDEA DH BB D 0 D ם‎ D 0 D םמ‎ D 0 D 0 evs 0 ם ם‎ 0 U 
devfs register blkdev()] | U 0000000000 fs/devfs/base.cO 00000 


[** 

* devfs register blkdev - Cptionally register a conventional block driver. 
@aj or: The major number for the dri ver. 

(pane: The nane of the driver (as seen in / proc/ devi ces). 

@dops: The & ock devi ce operations structure pointer. 











This function wll register a block driver provi ded the "devfs-onl y" 
option was not provided at boot tine. 
Returns 0 on success, else a negative error code on failure. 


* X * * * XX 


int devfs register blkdev (unsigned int najor, const char *nane, 
struct block device operations *bdops) 


if (boot options &CPIIONCON Y) return 0; 


return register blkdev (najor, nane, bdops); 
L /* End Function devfs register blkdev */ 
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O0O0000000000000000000‏ 


2J0000000000 


O0000000000000000000000000 700000000000 
U U 
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generic file read) 
generic file write() 
bread() 
breada() 


getblk() 


000000000000 11.7 ם 


0000000000000 read 10 wite הםםםהההההפטההההה‎ 
read] wite[] )[I00000000000000000000000000000000 
OO00000000000000000000000000 generic file read ( )[ 
generic file wite ( 10 DD 0 0 D 0000 0 0 0000000 DD 00000 DD D 
U D DDD DDD DDD DDD D D በ በ በ read] witer 0 D 0 [| generic file read 
( ה(‎ generic file wite ( ה(‎ 

U D D D 0 0 D D D D 00 D D D 00 D D D 0 D D D DD 00 በ በ U 
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U 
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DOO000000000000000000000000000000 


0 
U U U 0 U U 
O0O00000000000000000000000000 


U D D 0 U 
000000000000000 read D wite 00000000000 U U 
[] generic file read ( )[] generic ההההההההה()16₪%6‎ vor 00 
U DU 0000 DD D 0 D 41. 14) D U D U D D D 0 D D D D 0 D םי‎ 0 0 U 
U U 
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U U 
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או‎ )O OOO በ 11 rwblock ) D NO000000000000000000 
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U U U በ 0 U D U 0 U D U D 0 0 0 D 0 00 D U 0 0 0 0 0 0 0 0 0 0 0 0 U በ በ OO 
U D D D D 0 00 bred )በ breada( 10 D 0000 D D D D 0 0 0 0 0 D D 0 U 
OOO gethk )[ 11 rwblock( )[ 0 D 
םםםםםםםםםםםםםםםםםםםהםנסע בםםםםםםםםםםםםםה‎ 
OO םםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםםםםהההאם‎ 
םםםםםםם‎ 2ZO000000000000000000 םםםםםםםםםםנסע‎ 


A) D D 00 U 


U U 0 U D U 000000000 000 U DU 0 U DU 0 0 U 0 0 0 U U 0 0 U U U 
םםםםםםםםםםםםה‎ /00000000000000000000000000 
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I) EAE. ELE: ELE) 
E EL EI EL ELE E? 
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EVEVENEVE ERT ERT D EST E=]: ETT ER sea Se) EZ ET ET SES E=]: El 
בם‎ 
בם‎ 
בם‎ 
בם‎ 
EI 
Oo 
El 
בם‎ 
בם‎ 
בם‎ 
בם‎ 
בם‎ 
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El ELE 22 218 EE: 2 ESTE: ep = 28. El EE 











ET ELE E ES ET EH EE EN 
EL Ma ENG H wa l וב‎ ET. E EK ELE a EIS EISE E == 


ETE) ET 


U U U 
request [] [] 0 E] E] E] [[] [| D 0 incl ude/1i nux/ bl kdev. HT 


* Ck this is an expanded formso that ve can use the sane 
* request for paging requests. 
*/ 
struct request { 
struct list head queue; 
int elevator sequence; 
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U 
[] 
0 
U 
[] 
[] 
[] 
0 
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[] 
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U 
[] 
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U U U 
U U U 
U U U 
U U U 


o 
o 
፦ 
o9 


~ 
x 


volatile int rq status; /* should split this into a fewstatus bits */ 


#define RQ I MCI VE (-D 
#define RQ ACII VE 1 
define RQ SCS BUSY Oxf fff 
#defi ne RQ SCS DOE Oxfffe 
#define RQ SCS DSONNUIINS 0 
kdev t rq dev; 
int cnd; /* READ or WATE */ 


int errors; 
unsi gned | ong sector; 
unsi gned | ong nr_sectors; 
unsi gned long hard sector, hard nr sectors; 
unsi gned int nr_segnents; 
unsigned int nr hwsegnents; 
unsi gned 1 ong current nr sectors; 
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voi d * special; 

char * buffer; 

struct conpl 611 on * waiting; 

struct buffer head * bh; 

struct buffer head * bhtail; 

request_queue t *% 
L 
O0000000000220000000000000000000000000 
U D DD 0 0 D DD 00 DD DD D D D D D D D D D D D 0 D 0 D 0 D 0 0 D 00 0 0 U 
struct request [] D 000000 
םםםםםםםםם‎ cd D DD DDD በ םםםםםםםםהפצא‎ RAD በበ | 
OOOO התא‎ DOO D UD rq status 0 D 0 D 0 D D D D D በበበ 0 0 0 D U 
U D DDD D 00000 0 שתאאזנא‎ D 0 0 0 0 D 0 0 0 0 RATVEIOOO 
U D D D 0 0 D D D 0 D 0 D 00 0 D በ (UT 
000000000000000 ra. dev D D DD በ DD በ sector በ በ [ 
U U D 0 D 0 D 0 D sector [| current nr sector [ [ I] 0 U 
sector] nr sector [| current nr sector [] [] הה‎ 1]111111]1[] | 1] [1] D] 
U 
በበበበበ በ DDD DDD DD 0 DDD 0 DD D DDD D በ በ breqnext [| 
0000000000000 םםםםםםםםםםםההההואש הפ‎ 


5 
Ho 














oo buffer D DDD 0 0 0 0 DD D D 0 D 000000 DD D D 0 000 U 
הפ םםםםםםם‎ NOO DD DU 0 DD DD D D 000 DD D D 
0000 breqext D D D 0 0 D D U 
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U U U 
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U 
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U U 
U U 
U U 
U U 
U U 
U U 
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[] U U U 
U U U EH HHH HL HHH D U U 0 D 0 AE 00 םמ ם‎ D D 
request queue t D D D D D D DD wit for reqvest 000000000000000 
U U U 
U U U 








DD OO get request wait 10 000000000000000‏ םםםםםםםם 
get reqest( 10 D D D D 0 0 0 D 0 0 U‏ םםםםםםםםםםםםםםםםםם 
NI]‏ םםםםםםםםםםםםםםםםם 


410000 


OOO000000000000000000000000000000 next D U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
በገ በ 0 U D 00 0000 U 

U U U U D U 0 00000000 0 DU U D U 0 U DU 0 0 0 000 0 00 0 00 U 
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DOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 


OOO0000000000000 
struct request queue 















































1 
/ * 
* the queue request freelist, one for reads and one for wites 
*/ 
struct request_list rd 2]; 
/ * 
* Together wth queue head for cacheline shari ng 
Ej 
struct list head queue head; 
elevator t el evator; 
request fn proc * request fn; 
nerge request fn * back nerge fn; 
nerge request fn * front nerge fn; 
nerge requests fn * nerge requests fn; 
nake request fn * nake request fn; 
plug devi ce fn * plug devi ce fn; 
/ * 


* The queue owner gets to use this for whatever they like. 
* 11 rwhlk doesn't touch it. 

*/ 

voi 1 * queuedat a; 


/* 
* This is used to renove the plug when tq disk runs. 
*/ 

struct tq struct plug tq; 


/* 

* Boolean that indicates whether this queue is plugged or not. 
*/ 

char pl ugged; 


/ * 

* Boolean that indicates whether current request is active or 
* not. 

*/ 

char head active; 


/* 

* Is neant to protect the queue in the future instead of 
* 10 request lock 

*/ 

spi nl 00% + queue 1 ock; 


/* 
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typedef 
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* Tasks wait here for free request 
*/ 
wait queue head t wait for request; 


struct request queue request queue t; 


በ O O request listOOOOOOOOOOOOOOOOOOOO 
struct request list ( 


L 


unsi gned int count; 
struct list head free; 


U U U U D U D 0 0 00 000000 000 U 

elevator L D D NOON DD DD 0 00 DD D D D D 0 ከ H D D request fn proc 
0 plug device fn D 0000000000 request fn D D D 0 0 D D 0 0 0 U 
request fn proc D 0 0 [] [] request fn proc] D  #ypedef 0 0000000 


typedef 
U U U 
00000 
00000 
U D LU 
utut 
00000 











void (request fn proc) (request queue t *q) 

U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D 0 D D D D D D D D 0 D 0 [0 
U U D D D 0 0 0 0 D D D D D D 0 0 0 D 0 D request quee] D 0 D 0 D 0 
U U U 
በ በ D D በ request fn 10 DD 0 D D D DD 0 0 0 D D 000 D 0 DD 0 0 
U U D 0 D 0 0 D 0 0 D 0 D D 0 D 0 D D 0 D 0 D 0 D D D 0 D D 0 0 0 [0 
U U D 0 D 0 0 D 0 D D በ 











םםםםםםםםםםת 


U U U 


0000000 bk dev struct D በ በበ D D D D 0 0 0 0 0 D U 


struct blk dev struct + 


ከ 
U U U 
U uult 
00000 


/* 
* queue proc has to be atomic 


request queue L request queue 
queue proc *queue 
voi d *dat a; 


U U U U D U በ 0 ፲ D request queue] O 0000000000 queue] 
OO OG O000000000000000000000000000000 
OOOOO000000000000000000000000000000 


data] QO ה‎ 0000000000000 


U U U 


struct 


U U U 








hk dev r‏ םםםםםםםםםם 
blk dev struct blk dev[ MX H KTV:‏ 


O0O00000000000000000000000000000000 


OOO00000000000000000000000 generic file read ( )[ 
generic file wite ( 10 DD 000 DD D D D D 0 0 0 DDD DD 0 D 0000 D 0 U 


U U U U U 


























bk dev struct DO‏ םםםםםםםםםםםםםםםםםםםםםםםםהם 


OO 1.80000 0000000000000000000000000000000d 
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U U 0 U D 000000 000 ቨ ሀ U 

በ] 11.800000000000000 buffer her םםםםםםםםםםםםהה‎ 
םםםםםםםם‎ befferhbeadQO00,000000000000000000000 
בםםםםםםםםםםםםםםםםם‎ buffer heard D DU request 0000000 
OOO000000000000000 buffer fead D ה‎ 0 DD D D D D 0 0 0 0 D 0 DUU 
U U በ U D በ request D 0 0 U በበበ U D 0 0 0 0 0 D 0 0 0 በ 





L1 























ከ1: በርሃ 


request 










blk bcv struct 





b blocknr 


0000000 11.8 ם 







םםםםםםםםםםהםם 11.33 


DO000000000000 generic file read ( )] generic file wite () Ú 


U U D D D 0 0 0 0 0 D D U 
58126 t generic file read(struct file * filp, char * buf, size t count, loff t *ppos) 


58126 t generic file wite(struct file *111 6, const char *buf,size t count, loff t *ppos) 
םםםםםםםםם‎ 
םםםםםםםםםםםםםםטםםםםטםתות‎ 

BED D D D D D D D D D D D D D D D generic file read] 0000000000 


U D D DDD 00 DDD 0 generic file wite] 0 0 0 DDD D D D D 0 0 0 D 0 0 U 


U U U 
הש‎ D 0 D 0 0 0 [| L 
ppos[] D D 1 በበ D D DD 0 0 000 DD DD 0 0 0 DD filp post [0000 
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U U 0 UD 000000 U 
OO00000000000000000000000000000000000 
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superfornat ] 0000000 /dev/fd0N D 0 0 0 D D 0 D D D 0 D D D D D D חאש‎ 
0000 generic file witQ] DD D DD D 00 D D D D 0 00 DD DDD 0 0 00 0 U 


U uuu 
U uuu 








U U 


U U U DD D 00 DDD 0 0 0 00 [ 
bread( )[] breada( ) [] [] 





U U 0 በ ገበ በበበ በበበ በበበ በበን በሀገ 00 0000 U 


bread 10 0 DON D D D D 0 00 DD DDD 0 0 00000 DD 0 D 0000 U 


U uuu 
U uuu 





0000 bread )D D DU 








fs/ buffer. c[] [] 


[** 








U D D DD 0 0 bread 10 0 D D 0 D D D D 0 0 0 0 D D D D 0 0 
OOO0000000000000000 generic file read] 00000 


























U U U U UU 00000 0 U U 000 0 U በበ 0000 0 U 


+ bread() - reads a specified block and returns the bh 
* @ ock: nunber of block 

* (8126: size (in bytes) to read 

* 


+ Reads a specified block, and returns buffer head that 
X contains it. It returns NIL if the block vas unreadable. 


*/ 


struct buffer head * bread(kdev t dev, int block, int size) 


{ 


struct buffer head * bh; 


bh = getbl k( dev, block, size); 
touch buffer(bh); 
if (buffer uptodate(bh)) 


return bh; 


11 rwblock( READ 1, Sh, 
wai + on buffer(bh): 
if (buffer uptodate(bh)) 


} 
U U U U D U D 0 U 


return bh; 
brel 506) bb); 
return NIL; 


- OO gtbk 00 O00000000000000000000000000 
መዚ 10 D D 0 00 DD DD 00 0 

e DO buffer uptodate] በበ 0 D D 0 D D D D 0 0 DDD DDD D 0 D D D D U 
getblk( )[ [ 0 

e םםםםםםםםםםםםםםםםהםם‎ 1 rwhock )JOJOOOOOOO 

e I00000000000000000000000 vit on bffer( )H D] D D 
U D DDD 00 D D D D 000 bwitQQOO0O0000000000000000000d 
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U U U 

breada( )[] bread 10 D D D 0 0 0 DDD D D 0 D 0 0 0 D 0 D D D D 0 000 U 
U U 0 U D 00 0000000 U DUDU U D U 0 0 0 U 00 0 00 0 0 0 0 D U 0 U D U 
םםםםםםםםםםם‎ 


4111 rwblock( )[ O 


ll םםםםםםםםםםםםםםםםםםםםהםםםםהםםםהםהםהה(אסבשט‎ 


U D D 0 0 0 0 D 0 0 U 
void Il rwhiock(int rw int nr, struct buffer head * bhs[]) 


U U U U D U  [ 

- OOOO rw 00000 READ) WTH] RAD [| WIEN D D D 0 D D D D D 
OOO00000000000000000000000000000000000 

* 111000 mi 

- oo Ne) DDD መበበበበበበበበበበበበበበበበ[በበበ[በበበ[በበበ[ቨበ 
U U U U U U ሀ በ ቨ ሀ U UU 


0000000 011 rwblk. cho 
void 11 rwblock(int rw int nr, struct buffer head * 15] [( 
1 





unsigned int naj or; 
int correct_size; 
int i; 


if (!nr) 
return; 


naj or = MJ OK bhs[ 0] - >b dev); 


/* Determine correct block size for this device. */ 
correct size = get hardsect size( bhs[ 0[- >b dev); 


/* Verify requested block sizes. */ 
for (i 20; i «nr; it) + 
struct buffer head *bh = bhs[i]; 
if (bh- > size %correct size) + 
pri nt k( KERN NOITCGE "Il rwblock: device 96: " 
"only % char blocks inpl enented (%i)\n", 
kdevnane( bhs[ 0] - >b dev), 
correct_size, bh >b size); 
goto sorry; 


} 
if ((rw& WATE) S&is read onl y(bhs[0]- 2b dev)) I 
pri nt k( KERN NOI CE "Gi t write to read-only device %\n", 


kdevnane( bhs[ 0]- >b dev)); 
goto sorry; 
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for (i =0; i <m; 148 I 
struct buffer head “bh = 1; 


/* Qly one thread can actually submit the I/O */ 
if (test and set bit(HILock &h-> state)) 
conti nue; 





/* Vé have the buffer lock */ 
atomic inc( &bh- >b count); 
bh- > end io = end buffer io sync; 


swtch(rw 1 
case W TE: 
if (latomc set buffer clean(bh)) 
/* Hmph! Nothing to wite */ 


goto end io; 
. mark buffer cl ean( bh); 
break: 
case READ‘: 
case READ 


if (buffer uptodate(bh)) 
/* Hmph! Already have it */ 


goto end io; 
break; 
default: 
BA), 
end 10: 
bh- >b end 10(ከኪ test bit( 1112000916, Et > state); 
conti nue, 
› 
submit bh(rw bh); 
› 
return; 
sorry: 
/* Nike sure ve don't get infinite dirty retries.. */ 
for (i 20; i «nr; i4) 
mark buffer clean(bhs[i]); 
T 


םםםםםםםםםםם 
םםםםםםםםםםםםםםםםםםםםםםםםהםהםהה OO ll rwbl ockON‏ 


N0 0000000000000 robits በ በ O drivers/block/ll אע‎ cf] Ú 
static long ro bi ts[ MX H KTEV|[ 8]; 


1691()በ00[0000000ቨ 1‏ םםםםםםםםםםםםםםםםםםםםםם 
D D D D D D 000000 0‏ 0 0 0 מש is read‏ םםםםםםםםםםםםםםם 0 
O 1]‏ 


dd 














for)0000000000000000000000000‏ 20 םםםםםםםם 
ב 0000000 U D DU D 00 D D D D 0 0 DD D D 0 buffer fead D‏ 
end buffer io sync] D 0 D 0 D 0 D D D D D DD D D D D 0 0 DD D 0000 D 0 U‏ ][ 
BiDrty 0 0 000 ብበበበበበበበበበበበበበበበበበበበበ enn‏ 000 
mark buffer_clean(bh) D 0000000000 UD D D UD D DD D D D 0 0 0 0 0‏ 
D buffer_uptodaté] DD 000 000 D D D D 0 D 0 DD D D D 0 0 0 D D 0 D D D D 0 0‏ 
מםםםםםםםםיםםםיםםםםםםההה suit‏ םםםםםםםםםםםם 
U U 0 U U 00 0000 00 D U DU 0 0 D U 00000 U‏ 















































11.34 RAMP | D U | [| U [| 


10 RAM] D 0 Ú 
OO RMD በ በበ በበበ D D 0 0 0 D 00000000 0 0 D 000000 0 U 


U U U DD U D 0 DET BIB 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםהואא‎ 
םםםםםםםםםטםטםההאאנםםםםםםטםםםםםםםםםםםםםםם‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U DU 0 U D 0 0 0 U 
הא‎ D D 0 0 0 D 0 D D 0 0 0 0 0 D 0 0 0 0 000000 0 00 0000 0000 U 


U U 0 0 NOD መብ በበበ D 0 0 0 0 D 0 D 0 RAM D 0 0 D 0 D D D 0 0 0 U 
በበበበበበበበ 0 0 D D 0 0 bO D 0 0 D 0 0 0 D D 0 D 0 0 0 0 D 0 0 MOO 






























































4] Linx] RMD 0 000 [| 


RAM] D D D 0 0 D 0 D 0 0 0 0 0 0 D 0 0 D D D 0 0 0 0 D 0 0 0 BAM 0 0 0 U 
נםםםםםםםםםםםםםםםםםםם‎ AM D DD 0 0 0 0000 0 000.0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U በ 0 U D 00 0000 U 


000 םםםםםההאא‎ 
5 static struct block device operations rd bd op = 1 


owner: THS MILLE 
open: rd open, 
ioctl: rd ioctl, 


מ 
םםםםםםםם םהה rdopn()‏ 100 םםםםםה אאא linux | በ‏ 0 
סםםםםםםםםםםםםםהםםהםםהםהםהםםהםההםהההפתאז INTROMNA] OO‏ 


0000 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםס‎ 
filp 2 op = &nitrd fops[] 
static struct file operations initrd fops = + 
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read: initrd read, 
rel ease: initrd release, 

L 
በበ 1ዝኣጩ D D D 0 0 | 000000000000000 በ 1n trd read ( ን | Ú 
U DD 00 0 D D 0 D ם םם םםםםם‎ በ D nenepy tofs (baf | (char +) 
initrd start#ile + pos[] count ) [] ה ה ה‎ initrd release () 000000000 
000000000000000 IN™®0 000000000 
OOO RD D DD D D D [በ [በ በ በ rdicctl () 000000000000000 
בםםםםםםםה םםםם‎ 
BAAM D D D D 0 0 D 0 D 0 DD 0 D 000 DD 00 DD DD 00 DDD 00 0 0 
U U U U 000 000 0 000 0 U 

int init nodul e( voi d)[] /ሚ] ף‎ rdinit()*/ 

void cleanup nodule(void) 1] D D 0 D D D D 0 D 0 D 0 0 D 0 D 0 000 0 0 U 
OOO ram ak [] | [| [| 

RAM] ] 0] O 30000000000000 

1Q int identify randi sk inage(kdev t device, struct file “fp int‏ ה 
start block) [|‏ 
0O0O0000000000000000000000000000‏ 
static void rd load i nage( kdev t device int offset)‏ 20 ][ 
RAM" [| [| በ በ በ በ offset [10 D‏ 000000 
void rd load ( )‏ 30 ][ 
RO Nn በ‏ םםםםםםםםםםםםםםם 
Domm 000 RD 000 DDD 0000 D 00 0 DD 00 0 0‏ 0000000 
םםםםםםםב- םםםםםם 

















E 
































11.35 000000000 


































































































100000 

በገ U D U D 0 0 0 D 0 0 0 00 DU U D 0 0 U D U 0 0 0 000 00 0 0 U U U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U U U U D 0 0 0 በበ 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
D D DDD 0000 DDD D IÆ Integrated Drive H ectroni cs] D 00000000 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU በበበ 0 0 U 
U U U U 

U U U U D U D 0 0 0 D 0 0 0 0000 U D U 0 U DU 0 0 0 000 0 00 0 U D U 
OOO000000000000000000000000000 14.40 (900000 
U U U U 0 U D U 


























[ 11.1 (a) 1ቹ111010[ 0 














































































































































































































A A A 000 000 
0 0 0 uu U D 
0 0 0 00 U U 0 U 
0 0 0 OOOO U 0 0 0 
0 1 1 (D ue [לנסםםםם‎ 
1 0 0 0000008 159 በበበ በበ ሀ & NI 
1 0 0 በበ በ በ በ 167 230 በ] በ በ በ በ 16] 230 
1 1 0 O000000024 27] O000000024 27] 
1 1 1 u uu 
[ 11.1 (BID D D 70 0 000000 0 
ET ET BEF 1 0 
1 IPA 1 D H53 ፲82 HI HO 
IB] O 2n 0 0/0 0 7D U U 
1-000000 
Dj 0=0000 
1-000 
Fin] GS 000 980000 በ D 8 
TAN D D በ በ በ በ 249 27 
[ 11.1 LOD 000000000000 
U uu 
19 OOO 1000000000000000000000 
11 OOO 100000000000000 1049000000 00 
D በበበ 100000000 
Dt OOO 100000000 800000000000000 100 acr 
15 uuu 10000000 CD DDD 000000 0 
D OOO 100000 בםבםםםםהפ‎ 
[ 1 םםםםםםםםםםבפ)‎ 
ה‎ uu 
D U D 0 000.000 00000 DDD D D 
11 O000000000000000000000 
₪ uu 
18 םםםםםםםם‎ MO D 000000 0 
Dt 000000 
D O00000000000 
15 O00000000000 
D/ O000000000000000000 
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0 11.1 ()00000000 



























































[0 [/[8080[08:2ወ 
ooo 0001R3R2RIR0 

በበ 1111R3R2RIR0 

ooo 00101 MT 

በ00 00110MT 

በበ ID 01000000 

ooo 01010000 














RO RD D 0 00 0 0 00000 0 
םםםםםםם:‎ 120000 BRY BRAIN 0 0000000000000000 D D 0 
DIA0000000000000 
MD D 0 D D D D D 0 M0 DD 00000 0 
U M0, 000000 
T 0000000 0 9000000 
U 40000000 


U U U U D U D 0 0 0 D 0 0 000000 DU 0 0 D U D U 0 000 0 00 0 00 U 
U U U በ በበበ በበ በበበ D 0 0 0 0 0 0 0 00 0 0 0 0 0 0 UU D 0 U D 0 0 U D U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U U U 


20 inxJ000000000 


U DD 0 D D D D D D D D 0 0 O divers/id/hdc 0 OOOOO 
incl ude/ Li nux/ hdreg. h D D D 0 0 0 D D D D D D 0 0 0 D DD D D 0 D 0000 D 0 U 
U U U [በ በ U U D 00 00000000 DU 0 U DU D 0 U 

nx 0 D D 0 በበበ በበበ በበ በበ 00 0 00 L 


U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D 0 D D D D D D D D 0 D 0 [0 
static struct block device operations hd fops = í 





open: hd_open, 
rel ease: hd rel ease, 
ioctl: hd ioctl, 


E 
םםםםםםםם‎ 30000000000 ከበ open ( ን O hd release C ) HD D 
OOO000000000000000000000000000000000000 ቭ 
000000000000 hd release ( ) 0000000000 1] 
U U U U 0 D 0 0 DD D 0 DD D U D D D UD 0 D D D U D D D 0 D D U 0 D 0 D 0 D 
םבםםםםםםםםםםםםםםם‎ hic 0 D DDD 0 haot () 000000000 


U D DD 0 0 D 0 D 00 DD DD D D 0 U 
static void ከበ out(unsigned int drive, unsi 0060 int nsect, unsigned int sect, 
unsigned int head, unsigned int cyl, unsigned int cnd, 
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0000 BVC INR] 
hd request () OOO 
U U U DD U D 0 0 0 D U 
U U U UD D U D 0 0 ቨ ሀ U 
U U U UD D U D 0 0 0 0 U 
U U U DU 0 00000 U 
U U U UD 0 UD UU 00 U 








U D D D dive 0 DD 0 0 0 D DD D መይ 0000000000 sect [0000 
U D D 0 0 head 0 0 0 D D D D D cm DD D 0 0 000 0 U 
U U U U D U D 0 0 0 D 0 0 0 0000 0 DU 0 U DU 0 0 0 000 0 00 0 U D U 
םםםםםםם‎ መበበበበበበበበ0000000 SEIN intr addr) OOO 














oo DI DI 
void (*i ntr_addr) (voi d)); 






































o 
o 


በበበ] 0] [በበበ D U DU 0 U DU D 0 00 ሀ[ 
U U U UD U U D 0 0 0 D U 0 0000000 U DU 0 U D U 
U U U UD U U D 0 0 0 D U 0 0000000 U DU 0 U D U 
U U U UD U U D 0 0 0 D U 0 0000000 U DU 0 U D U 
00000 hd out (900000 BMG INT] hd request( ) 
hd out()D D D 0000 

















Ed EN ER‏ ב 


U U U U D U D 0 0 0 D 0 0000000 DU 0 UD U D U 0 0 0 0 0 D U 0 DU U 


Q 1] voi d unexpected hd interrupt (voi d) 


OOO00000000000000 הפאש‎ 


[] 20 static void bad rwintr(voi d) 






































O0O0000000000000000000 


e O00 4000000 
e O00 80000000 


e O00 160000 


[] 3] static void rec 


U U 0 U D 00 00 U 


U U U D 0 0 0 D 0 U 
[] 50 static void wi 





D 6] static void hd 
U U U D 0 U 0 D 0 U 
0000000000 














U U 0 U D 00 00 U 
מםםםםםםםםםםם‎ 





מםםםםםםםםםםם 


U D D D D D D D hdinterupt םםםםםםהה()‎ PEMCE INRU 000000000 
[] DMG INR] ה‎ [| [] Ü ] unexpected hd interrupt C)[] D] [] 


D D 0 0 contorller ready ( ) 0 0 D 0 0 D U 0 D D 0 drive busy ( ) በ‏ םםםםםם 


U U 
al intr(voi d) 
00000 


[] ቭ] static void read i ntr(voi d) 


U U U U 
te intr(voi d) 


i nt erupt (voi d) 
U U U U 000 0 U 
000000 hdinterupt םםםםםםהםםהםההה()‎ 














U U U U U U 0 00000000 00 0 U D U 0 U D 000 U 
U D [ በ 0 [በ check status () 000000000000 





dwp status (1 DD D D D D 0 0 OD‏ םםםםםםםםםם 


wit ()סם‎ D 00 DD 0 D D 00 HL 





























U U U U D 00 00 U 


U U U U U U 000000000 00 0 U DU 0 U D U D 0 U 





D DD 0000 0 0 0 bdrwinr () 0 0 0 0 D D D D D D D U 
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reset controller ( ) [] reset hd ) [] 
OO hdint () O0O0000000000000000000000000000 





000 RMD D 0 D 0 D D D D 0 0 0 D 0 D 0 0 0000 0 0 D 0000 U 








O0O0000000000000000000000000000000000 
O0O0000000000000000000000000000000000 











































































































[] 
0 
U U U UD 0 U D U 0 U D U D U 0 U D 0 0 0 000 0000 0 0 U U D U 0 U D U U 
[] 
[] 


11:4: DO YU 


U U 00000 ጨጃበበበበበበገበበበዘበበበበበበበበ[በ[በ[በ[ 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 ሀ U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 UD ህበ ሀ ሀ U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 [በበ U 0 U DU 00 በ; 
U D D 0 TIN TIYO D 0 0 D D D DD D 00 D 400000000 000000 
U D DD DD 10600 6230 000000000064 45000 19200000 

O0O00000000000000000000000000000000000 
መበበበበ” በበበ” ቨበበበበበበበበበበበበበበበ םםםםםםםםםרא‎ 

በገ] በበ D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U 0 U DU 00 ሀቨ 

/dew mem 0 200000000‏ 10000000 םםםםםםםיםםםם"ם 

0 dev knend] 0 3000" 000” םםםםההונש נש‎ 8000 

/dev/randon] N I D D D D D 0 0 0 D DD D D D D 0 0 0 D 0 D D D D D Ú Linx] 
U D Docunentation/devices.txt D D D D D D D 0 0 D 00 D D D D 0 0 0 UD D U 

በገ [በ በ U D 0 0 0 D U 00 U 


ET ENE NET 
[=]; BE... E) 














Oo 


= 











les fe es Bez ₪2 G == 


L1 
E 
E 
L1 




















םםםםםםםםהה 1141 


D D D D 0 D D 0 D 00 D‏ שש יםםםיםםםםםםםםםםםםםםם 
U U U U 0 0 0000 0 000 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 U‏ 

በገ] 0 D 0 0 0 D በ በበበ በበ በበበ D UD D D D UD D D D U D D 0 U D 
በገ]በ]በበበገበበበበበበበበበበበበበበበበ”በበበ”በሽበበበበበ[በ[በ[በበ[ 
0 dev/ null NANO በበበ 00000000000000 1 
P000 000000 10000000 una / DDD N0000 000000000 
םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ MMMQ MOOD 
incl ude/ 11 nux/ naj or. h[] [| 

#define MMM CR 1 
D file operatins [] [| | nenory fops] [| [1 O drei vers/ char/ nemc [] 
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static struct file operations nenory fops = + 
open: nenory open, /* just a selector for the real open */ 


F 
በ በበበ በ በ 100000000000000 0000000000000000 
000000000000000 nenory ፤ጭ[ 00000 file operati ons [] [1 (1 D በ 


OU nory open] D D 0 D 0 D 0 D D D D D 0 0 0 0 D 0 D በ 0 በ 
static int nenory open( struct inode * inode, struct file * filp) 
{ 


swtch (MINH inode- > rdev)) í 


case 1: 

filp + op = &emfops; 
break; 
case 2: 
filp + op = &nemf ops; 

break; 

case 3: 
filp op = Gull fops; 


break; 


} 
if (filp * op &filp >f_op >open) 
return fil p A _ op- >pen(i node, fil p); 
return 0; 
} 
O H /de/ null 000000 30000 file operations] [ | null fops[] 
static struct file operations null fops = 1 


11 seek: mill 1 % 
read: read null, 
wite: wite null, 


bi 
U D 000000000 open D NUNO 0 D 00000 00000000000 
םםםםםםםםםםםםםםהםםםהםה0פםם‎ wite 8:1()10[1 1 በ D U 
static 58126 t wite null(struct file * file, const char * buf, 
size t count, loff t *ppos) 
t 


return count; 


} 
በገ] በ D U D 0 0 U D 0 0 0 0 D D U 0 D U ርጩበበ 0 0 0 0 0 0 D 0 0 uu 
በገ U 0 U D 00 0000 U 


D D DD 0000 D DDD DDD reed nil[] 0 D D D 0 D 

static 55120 t read null(struct file * file, char * buf, 
size L count, loff_t *ppos) 

{ 


return 0; 


} 
OO בםםםםםםםהםס‎ 9000000000000000000000000000 
በገ] U D U D 0 0 U D 0 000000000 0 DD U D U 0 U 0 U 
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םםםםםםםםםהה 11.42 


םםםםםםההה ]1[ device struc‏ בםםםםםםםהםםםםםםםםםםםםם 
fs/devices. cf]‏ םח ם DH‏ ם 


struct device struct + 
const char * nane; 
struct file operations * fops; 















































bi 

000 nane D 0 D D በበበበበመ[ሸ በበበበበበበበበበበበበበበበበበበ[ ;[ 
QO device struct ה [ ה‎ [] HH [|] ה‎ chrdevs [| D 0 

static struct device struct chrdevs[ MX CHTEM; 


00000 2500000000000000000000000000 25000 
OO000000000000000000000000000000 ei 

chrdevs NO 0 0 0 O register chrdev( 10 D D D D D 0 0 0 0 D D D D 0 0 0 0 0 
[| unregi ster chrdev( 1D D D D 0 0 0 D D D D D D 0 0 0 000 register chrdev] [| 


ut 
int register chrdev(unsigned int najor, const char * nane, struct file operations *fops) 
1 








if (major =ዐ + 
wite lock( &hrdevs lock); 
for (naj or = MX GREV 1; mjor 5 0; najor--) í 
if (chrdevs[ naj or]. fops = NIL) + 
chrdevs[ naj or]. nane = nane; 
chrdevs[naj or]. fops = fops; 
wite unl ock( 660005 lock): 
return naj or; 
} 
} 
wite unl ock( 660005 lock): 
return - EBLBY; 


› 

if (major >= MX ORE) 
return - FNAL; 

wite I ock( &hrdevs lock): 

if (chrdevs[ naj or]. fops S&chrdevs[ naj or]. fops !=fops) í 

write unl ock( 660005 lock): 

return - FRLEY; 

› 

chrdevs[ naj or]. nane = nane; 

chrdevs[ naj or]. 1005 = fops; 

wite unl ock( 660005 lock): 

return 0; 


} 
rod O000000000 10000000000‏ םםםםםםםםםםםם 
םםםםםהה םםםםםםםםםםםםםםם 


chrdevs D 00‏ בםםםםםםםםםםםםםםםםםםםםםםםםםםהם 
register chrdev(6, "lp', &p fops):‏ 
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በበበበበ 100000000000 20 DD DDD DDD DD DD 0 DDD DD 
OOOOOOOOOO 
U D DD 0 0 D 0 D 0 DDD DD D D D 0 D D D D D D D D D D D D D D 0 0 D 0 U 
U D DD 0 0 D DD 00 DD DD D D D D D 0 D D D D D D D 0 D 0 D 0 0 D 00 0 0 U 
U D 0 D 0 D D 00 0 D 00 0 U 
D D DD DD DDD DDD 0 DDD D D file operations [ [] | fs/devices.c [] 
U D D 0 U 

/* 

* Dmny default file operations: the only thing this does 

* is contain the open that then fills in the correct operations 

* depending on the special file... 

* 

static struct file operations def chr fops = + 
open: chrdev open, 































































































Ẹ 
በበበበበበበበበበበበበ00 0 0 D file הט‎ 0000000000 
םםםםםם‎ [] file operations [| chrdev open [1 [10 000 


/* 
* Called every tine a character special file is opened 
Hi 
int chrdev open(struct inode * inode, struct 1116 * filp) 
1 
int ret =-ENIEV 


filp- op-get chrfops( MJ CR i node- ב‎ rdev), MNX inode- > rdev)); 
if (filp= op + 


ret =0; 
if (filp op “open ! = NID + 
lock kernel (); 
ret =filp- => op--open(inode, filp); 
unl ock kernel () ; 
› 
› 
return ret; 


} 

U D D D MOO D D MOO D D D D D D D 0 00 i rdev D D DD D D 0 0 0 0 0 
OOO000000000000 get chrfops 00 D D D D 0 0 DDD DD DD 000 0 U 
U U U U U U D U D U 0 ה‎ D UU Du 
U D D DD D D 0 D 0 open 10 DDD D DDD 000 DDD DD DD 000 DD 0 U 
םםםםםםםםה, אאסםםם‎ 
- םבםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 100000 
OOO000000000000000 
e [000000000000000000000000000000000000 
OOO0000000000000000000000000 
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[| | Linux | ul 


e U UU UU UU DU DUDUDU 00000 U 
e J000000000000000000000 
e JO00000000000000 

















1143 OOOOOOOOOOOOO 


U U U U D U D 0 0 0 D 0 0 0000000 U 0 0 D U D U 0 U D U 0 D 0 0 DU U 
U U U በበበ በበበ በበበ 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U UU ገበ በ በ 0 D 0 0 D U 0 D D U D 0 0 0 D U 0 0 0 0 0 0 00 0 DU 0 U D U 

engan‏ םםםםםםם האם םםםםםםםםםםםםםםםםםםםם 
U D D 000 DD DD cg o o‏ 


םםםםםםםםםםםםת 


OOO00000000000000000000000000000000000 
O0O0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000 

paramh U U U U D 00 U 

dir. ከ 00000000 

user. ከ U U U D 0 0 U 

tty.h U U U D 0 0 0 D 0 U 

፻5. ከ [| [] [፲ Buffer header [| [] 

U U U U U U UU 0 U U 

#incl ude di nux/ kernel. h> 

få ncl ude di nux/ nodul e. h> 

Af ONIG MDERTOS=1 /* DU OOI G MDERIOS */ 

#defi ne MDVERSI OS 

#incl ude 4 i nux/ nodversi ons. h> 

#endi f 

* םםםםםםםםםםםםם*! 

8001 ude dinux/fs.h> 

få ncl ude 4 i nux/ wapper. h> 














*OO000000000000000000% 

#fndef KERNEL VERSION 

#defi ne KERNEL VERS ON a, b, c) ((a)*65536+ b) *256+ c)) 
#endi f 

#f LINK VERSION COE > KERNEL VERGI ON 2, 4, 0) 

#incl ude <asniuaccess.h> /* for copy to user H 
#endi f 












































#defi ne DEVICE NAME "char dev" 
םםםםםםםםםםםםםם*‎ V 
*O00000000000000000000000000000000 v 
static int Devi ce Qen = 


/* 00000000 
static char Mssage[ BF LN 


/* 000000000 


*םםםםםםםםםםםםםםםם 
static char *Mssage Pr‏ 










































































*O00000000000 
static int Mjor; 


20 open () OO 
OOOO00000000000000000000000000 


static int device open(struct inode *inode, 
struct file *file) 


O 
כם‎ 
כם‎ 
口 
ם‎ 
口 
ם‎ 
LC 
口 
口 
[maa 
口 


*םםםםםםםםםהםם 





1 
static int counter = 0; 


#fdef [፻፪ 
printk ("device open( %, %)\n", inode, file); 
#endi f 


printk("Device: 58 %\n", 
inode- ב‎ rdev << 8, inode- ב‎ rdev &OxFF); 


/ፆሥቨበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበበ” 
if (Device en) 
return - EBUSY; 


Devi ce Qpen+; 


/*000000000000 
O000000000000000 
spri nt f ( Mssage, 
"If I told you orce, I tol 
count er 44; 
"Hilo, wrlAn"): 


U U U 0000000000000000 00 0000000 0 U 
QU 


U 
U / 
d 


you 58 tines - 58", 


1655800 Ptr = Mssage; 


/000000000000000000000000 
0 


U U 0 U 0000000000000 DUU 
בםםםםםםםםםםםםםםםםםםםםםםםםהם‎ 0000000000 0 0000 0 0 00 U 
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LU OI Linux [ 








return SUCCESS; 
} 


3] release () DO 


O0O0000000000000000000000000000 
#f LINK VERSION COE >= KERNEL. VERSION 2 4, 0) 
static int device rel ease(struct inode *1 node, 
struct file *file) 
Hel se 
static void devi ce rel ease(struct inode Xi node, 
struct file *file) 
#endi f 


t 
#fdef EBG 

printk ("device rel 0850) in %)\n", inode, file); 
#endi f 


/*O000000000000000% 
Devi ce (en --; 


*O0000000000000000000000000000000000000% 
MD IEC USE COLNE: 


41 LINK VERT ON COE >= KERNL VERSION 2, 4, 0) 
return 0 

Hendi f 

) 


ብ] read ( ) 00 


በበበ በበበ በበበ በበበበበበበበገበገበበበበበበበገበበበበበ[በበበ[ 
#f LINK VERS ርእ; OIE >= KENI VERSION 2, 4, 0) 
static 58126 t device read(struct file *file, 
char *buffer, /ፆገገገበ በበበበበበበበበሣ 
size t length /* በበበበበ ፲” 
loff t *offset) /* 000000 * 
Hel se 
static int device read(struct inode *inode, 
struct file *file, 
char *buffer, int length) 
#endi f 
1 
/* 000000000 v 
int bytes_read = 0; 
!* 00000000000000 ዐበገበበበበበበበሣ 
if (*Mssage Ptr = 0) 
return 0; 
!* 000000000 > 
wile (length &*Mssage Ftr) { 
/*000000000000000000000000000 copu to ה(‎ 0000000 
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U 000000000 >x 
copy to user(buffer-4; *(Mssage Ptr+), length -); 
bytes read +; 
› 


#fdef DEBUG 
printk ("Read 98 bytes, 58 left\n", 
bytes read length); 
Hendi f 


*םםםםםםםםםםםםהה */ 


return bytes read; 


› 
ሟ] wite() OO 


በገ]በበበ በበበ በበበ በበ በበበ በበበበበበበ በበበ 
#f LINK VERSION COE >= KENI. VERSION 2, 4, 0) 
static 58126 L device wite(struct file *file, 
const char *buffer, 
size t length 
loff_t *offset) 
Hel se 
static int device wite(struct inode *i node, 
struct file *file, 
const char *buffer, 


int length) 
#endi f 
1 
int i; 
#fdef FRG 
printk ("device wite(% 96,98)", file, buffer, length); 
Hendi f 


#f LINK VERS ON COE >= KERNL VERSION 2 4, 0) 
copy fromuser( Mssage, buffer] length); 


Mssage Ptr = Mssage; 


/* 00000000 ሣ 


return i; 


} 
ggg00000000000000000 


U U U U D U D 0 0 0 D 0 0 000000 DU 0 0 D U D U 0 U D U 0 D 0 0 DU U 
ה יצו בםםםםםםםםםםםםםםםםםםםםםםםםהם‎ 00 D D 0 U 


U U U U 


struct file operations Fops = { 
read: devi ce_read, 
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wite: device wite, 
open: devi ce open, 
release: device rel ease 


L 
D000000000000 


init nodule O000000000—00000000int role 0 0 0 Ú D 
[] nodule register chrdevf] D D D D D D D 0 0 DDD D D D D 0 D 0 D D D D DD D U 


U U U D 0000000000 
int init nodule() 
1 





*םםםםםם*! 

Mij or = nodule register chrdev( 0, 
TEV CE. NM, 
ops) ; 


!* *םםםםםהבםםם‎ 
if (Mjor <0) + 
printk )"% device failed wth %\n", 
"Sorry, registering the character", 
Mj or); 
return Mj or; 


} 


printk ("% The najor device nunber is 98. Vn, 
"Fegisteration is a success. ", 
Mj or); 
printk ("If you vant to talk to the device driver, Vn"); 
printk ("you'll have to create a device file. Vn"); 
printk ("W suggest you use: Vn"); 
printk ("nknod «nane» ር 58 <mnor>\n", Mj or); 
printk ("You can try different minor numbers 96", 
"and see what happens. 1n"): 


return 0; 

} 

በበበበ]በ]በ DD DD በበበበበበበበ /proeQ O00000000000 
voi d cl eanup_nodul e() 


{ 
int ret; 


/*QO00000* 
ret = nodule unregi ster chrdev( Mj or, DEV CE NM), 


!* 00000000000 * 
if (ret < 0) 
printk( "Error in unregister chrdev: Yin", ret); 
} 
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1144 0000000000 






























































U U U UD U U D 0 0 0 D U 0 0 000000000 0 U D U 0 U U U 


Ene 00‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם 
O0O000000000000000000000000000000000000‏ 
OOO000000000000000000000000000000000000‏ 
U D D 00000 DD DD 0 Hm D 00000 CD D DD DD ge DON OO DU‏ 
gccù DDD DD -c0 D 0 000 DD D U‏ נבםםםםםםםםםםפ>םםםםםםם 
השפםםםםםהההתתטשם. OO መ OO000000000-D KENT‏ 


EL Ej E=]: p=] œe me 








U D B] በ [በ [ *.00 በ /1i b/ nodu es/ xxxx/ nisc [T] xxxx D D D D D D OT DUU depnod 


aQ DDD DD 000 WOO insnodl D D D [T] omg n D D D [T] 0 0 D. lsnod 


U U 0 U 0 000000 000 ቨ ሀ U 


U U 0 U D 0000000000 U DU U D 0 0 U D U 










































































U U 0 00 U 


OOO00000000000000000000 in init nedue(void)[] [| insnod 
OOO0000000000000000000000000000int mdu e 00 0 
U DD DDD 00 DDD DD DD 0 D 00 D D D 00 void cleanup nodule (voi d)[] [| 


WOO register chrdev 0 0 O0 D D D. nknod‏ םם םם םםםםםםםםםםהםם 
DOO0000000000000000000000000000000000000‏ 
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U U U U UU 


Unx 111110. Umer 0 00000 000000 0 D 000 0 DD 00 U 
Wndow NG D D 0 0 0 0 D D D D 0 D 0 000 D DDD 00000 DD D D 0000 U 
OOO00000000000000000004000000000000000000 
O0O0000000000000 

በ Hn 111111. በ EnxkQO0O0000000000000000000 
םםםםםםםםםםםםםםםםםםםםםםםם‎ BawOOOOOOOOOOOO 
U U U UU 00000 


9 


o 














o 

















12.1 [ll 


EnxJO0000000000000000000000000 Umeg 0 0 0 U 
U UU U 0 0 0 0 0 U D U 0 U D U D 0 0 0 D 0 0 0 0 DU 0 0 0 0 0 0 0 U D 0 0 U D U 

0 19 ox JO00000000000000000000000000000000 
OO 4000000 121000 

















户 进程 
























































网 络 设备 











በ] 121 םםםםההאתם‎ 


U U U U D U D 0 0 00 0 000000 U DU 0 U DU 0 0 0 0000 00 0 0 bu 
በገ] በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 0 U 00000000 U DU 0 U D U NO 

2JinxJ000000000000000000000000000000000 
O0O00000000000000000 
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e OOOO (protoa)OOOOOOOOOOOOOOOOOOOOOOOOOOOO 

U U U U U U D 0 0 0 D U 00 U 
O (socket) D D D D 0 D 0 0 0 D D D D D D 00 D 000 DD D D D 1/4 
O0O0000000000000000000000000000000000000 
U U U 0 U U 
e OOOO (device and interface) | 0 0 DDD D D D D 0 0 DDD D D —H D — 
U U U U D U D 0 0 0 D 0 0 0 0 0000000000 00 U 
e םםםםםם‎ (sh bur FDD D D D D D 0 0 00 DD DD 0 DD D D D 0 00 UD 
U U U UD U U D 0 0 0 0 U 00000 000 U D U 0 U D U D 000 0 U 
0 40000000000 22000 




















° 
Co 
Co 



























































套 接 字 
Se 


EAT | 设备 接口 


daan 


በ] 122 HD0 00000000 00 


OO 22000000000 4000000 DD 000000 DD DD 0000 0 
םםםםםםםםםםםהם‎ 3000000000000000000 400000000 
U U U UU UD 0 U 

Dm J0000000000000000000000000000000000 
በገ] U U U D 0 0 0 0 U 00000 000 U D 0 0 U D U D U 0 0 D 00 0 000 U 



























































12.2: DADE 


U U U U D U D 0 0 0 D 0 0 0 00 DU U D U 0 U D U 0 0 000 0 U U 0 0 U U U 
O0O0000000000000000000000000000000000000 
O0O000000000000000000000000000000000000— 
-TO/ LPD D 0 0 D D D D D 00000 DD DD 0 0 


1221 000000 


םםחםםםםםםםטםםהנפצוםםםםםםםםםםםםםםםםםםםם 

U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
OOO00000000000GQ000000000000000000 

OO םםםםםםםםםםםםםםםםםםםםםםםםםה>‎ D 0000 U 

DDD 0 DD DDD DDD DD DDD 0 0‏ 000 שש םםםםםםםםםםםםםהם 
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TOW LH) D D TWLPD D D D D 0 0 D 0.0 D D D D 0 0 GL 0 DDD D ፲መሞዋቨቨቨቨ 
OO 121000 


























በ] 1 9 D D DDD TOO IPD 0 0 0 

₪ D UD TOP LEP D D 0 D 
000 
000 U U U 
000 
000 000 
000 Internet 
በ[[ U 0000 
000 000 




















2.22 TØYIPINDOOOOOO 


ዝቨፐ በበበ በ በ D D 0 D D 0 D 0 D 0 D D 0 0 0 0 00 TPIPOCOCODE 
םםםםםםםם‎ 22000 





0 2 שד‎ LP OO 
000 TENT FIP SMP INS 
000 RP UP 
Internet IP 
0000 ARPANET SAINED 
11111] PP SLIP LAN 





U U 0 0 0 0 0 0 IR] Internet 0000 000000000 


12.2.3 Internet [] [| 


IPOOO TIPO0000000000000 םםםםםםםםההא‎ 
IPOOOOOOOOOOOOOOOOOOOOOOOOOOIPOOOOOOOOO 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
םםםםםםםםםטםםםםםםםםםםםםהטםםםםםםםםםםםםםםםם‎ 
םםםםםםםםם‎ 
םםםםםםםםטםםםםםםםםםםםםםםםיםםםםיםםםםםםםתהלז‎ 
םםםםםםםםםטםםםההשםםםםםםםםםםםטםםםםםםםםםםםםםם‎ 
בםםםםםםםםםםםםםםםםםםםםםםםםםהםםםםםםם‎ 
םםםםםהש םםםםםםםםםםםםםטםםםםםםםםםםםםםםםהלז‎ 
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Linux 


12. 30000000 1P000000001P00000000000000000000 
U U 






























































TCP/IP O 0 ከ 8 0 
DD DD DD 


22222 25 AA 5፡9 ak 5 2 EA A םש‎ መመ ው. 











EI 
Te he 


























0000 U U U U 
























D 123 ኸ31፻0ከ [00 
LPU 0 0 D D D 0 0 0 LPU D 0 0 1፻00 0 םםםםםהשםהםםםהםםםחהלש‎ 


OO 12.4000 




































































[|| 12.4 IPOOGG 





12.2.4 TOP 


םםםםםםםםםםםטםםםםםםםםםםםםםםםםםםםםםםםםהשד 
OO0000000000000000000000000000000TP00000‏ 


—450 = 





םםםםםםםםההש םםםםםםםםםםםםםםםםםםםםםםםםםםםם 
U U U 0 IR]‏ 

TPD D D D D D INO LPD 0 D 0 0000 DD D 0 0 0 00 DD TE- uero D D 
U D D 0 NP 0 D 0 0 D 0 0 D D TOPH D 0 0 0 0 UD D CD D U D D ሀ 0 ሀ UU FD 
U TWPD D 0 0 0 00 U 

TFP תת‎ 0 0 D 0 םםםםםםההש‎ 2.5000 












































ALR D et 22828 O as 
FF eto 
BU = (2242) 
























































ሀ|ዶ|ዮ|ጾ|5 |F 


RE RE We 
Riz CERE) jBjkjHiT nH D aeto 









































Rea 紧急 指针 (18 位 ) 
选项 和 填充 
0125 ኸ፻ቨ D D 


























םםםםםםםם 

e 000000000 םםםםםםםםםםהםםההש‎ 16000 

e 000000000000 DUDU 16000 

e I000000000000000000000000TEQOOO0000000 
(UI) 

*。U000000000000000000000000000000000000 




















ש םםםםםםםםםם 
מםםםםםםםהםםםםםםהםם. 
םםםםםםםםםםטםש םםםםהםההתאת s‏ 
םםםםםםםםםםהםםהםהתאא 
መ D D D D D D D 00000 D U‏ 
D D D 0 0 0 0 0 0 0 0 0 0 0 D‏ אפ 


e H םםםםםםםםםםםםםםםםםםםםםםםםםםםהםםםםהא‎ 
U 


OOOO TWD D DD DDD 000 DD DD 00 0 
U U U U U U D 00 0000000000000 U 
םםםםםםםםם‎ LPD 0 0 00 DD DD 0 0 0 
0 םםםםםםםהש ד‎ 2.6000 
TPO DOO UPD D 0 0 0 D 0 D D D 0 000 BO 
000 SNO D D 0 0 10000000000 MO 
12.60 SYN 50[] 00 SD [| 0 በ D በ በ Mi S0000000000 
000 BD 0 0000 DD DD םםםםםםםםםםםםםההש‎ SNMIDDU 


ው - 

















U U 
U U 
[] U U U 

0 U U U 
0000 בםםםםםםםהםהש‎ 
U U U U 

U U U 
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OOO BOO TPOOO M. 0 D 0 D 00 D DDD AID 12.60 AX510 00000 BD 
OO0O00000000000N0 1260 SYN200 00 

















1[[0 ል ACK 51;SYN 200 


TCP 
ACK 201 





0 126 TPOOOOO 


000 נםםםםםםםםםםםםםםםםהא‎ Ni,000000000000 6 
በ AK 200000000000000000000 A0000 BOO UPOOOOOO 
U U U UD U U D 00 0 D U 
በበበበበበበበበበ1በ000080 TPU 0000 U 











12.3 0 [] Ú [ socket] 


12.31 0000000000000 


socket D D 0 D D D 0 D D D 0 DDD 0 DD 0 DDD 000 D 0 DDD 00 D 0 U 
OO0000000000000000000000000000000000 27000 





0 12.7 000000000000 


socket 000000000000 
በ 19 socket 00 DD DD 0 0000 DD DD 00000 D U 


-452-- 
































በ ሟ socket DDD DD 0000 DDD D 00 DDD DD 0 D 0000 D DD 0 0 0 
O 40 mx םהה‎ DD DD D D 0 D 0 D DD D D DD 00000 DD 0 U 
U U 0 U D 0000000000 U DU U D U 0 U D U 








123.2 00000000 


םםםםםםםםםםיםםםיםםםםםםםםםםםםםםםםםהנהה Dm‏ 
124 000000000000 אתםםםםםםםםםםםםםהםם 


BOY‏ םםםםםםםםהםטםםםהנפא םםםםםםםםםםםםהה האתגם 


BDOOOOO0O0000000000000000BDQ00000000‏ םבםםםםם 
בםםםםםהפא םםםםםה O0O0000000000000000000Gnx‏ 
DD DDD 000 DDD DDD 00 240000000000‏ 12.230 12.4000 








































































































































































































































































































Ú 3 limx 000000000 
000000 00 
UNX UNX0 000 
INET 00 TOIPOOOOO Internet OOO 
AX25 Mater radio X25 
APPLETALK Appl etalk OP 
IX Novell IPX 
X25 X25 
በ 124 אמג‎ 0000 ጩመ0000 
፳90000 0 
0በ000000000000000000000000000000 
OU stream 000000000000000000 1አ፳በ00በ0 TP0000 
0000000000000000000000000000000 
በ D 0 0 datagrang] 0000000000000000000000000000000 
000000 r 0000 UPO000 
00000000000000000000000000000000 
በ 0 0 raw 0000000000000000000000000000 IFO 
0000 
0000000 000000000000000000000000 
00000 000000000000000000 
በ በበ በ packetn ሣራ . ን ቲያ ያህእህያዯ iu E 
ugggg 1ገሓጭ በ በበ በበ ገ DD DD D በ በበበበበበበ[በ[[በ 





U U U U 
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123.3 00000000 


INTQOOOOOO Internet [በበበበበበበበ በበበ T0 0 0 BOO D 0 0 L 
OO 28000000000 Eng 000 DD DD 0000 U 


BSDÈRS 


INETE HF 





0 128 INTI |] 


INTO BD D D D D 0 0 D D D D Internet JO 000000000000000 


U D D 0 D 0 DD 0 D 0 [በ በ በ include/1i nux/net.h D 0 | proto ops] 
struct proto_ops + 


int family; 

int  (*release) (struct socket *sock); 

int  (*bind) (struct socket *sock, struct sockaddr *unyaddr, 
int sockaddr len); 

int  (*connect) (struct socket *sock, struct sockaddr *uservaddr, 


int sockaddr len, int flags); 
int  (*socketpair) (struct socket *sockl, struct socket *sock2); 


int  (*accept) (struct socket *sock, struct socket *newock, 
int flags); 
int  (*getnane) (struct socket *sock, struct sockaddr *uaddr, 


int *usockaddr len, int peer); 
unsigned int (*poll) (struct file *file, struct socket *sock, struct poll table struct 
*vait); 


int (*ioctl) (struct socket *sock, unsigned int cnd, 
unsi gned | ong arg); 
int  (*listen) (struct socket *sock, int len); 


int (*shutdow) (struct socket *sock, int flags); 

int (*setsockopt) (struct socket *sock, int level, int optnane, 
char *optval, int optlen); 

int (*getsockopt) (struct socket *sock, int level, int optnane, 
char *optval, int *optlen); 


int (*sendnsg) (struct socket *sock, struct nsghdr *m int total len struct 
scmcooki e *scn); 

int (*recvnsg) (struct socket *sock, struct nsghdr *m int total len, int flags, 
struct scmcookie *scn); 

int (*nmap) (struct file *file, struct socket *sock, struct vmarea struct * vna); 


Ssize t (*sendpage) (struct socket *sock, struct page *page, int offset, size t size, int 
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flags); 
L 
םםםםםםםםםםםםםם‎ file operations በበበ ፏጩ 0 D D D D D D በ 
proto os 0000000000000 BDO INTOOOOOO socket DO 
0000000 BSD[I DDD socket [ [] O incl ude/ Li nux/ net. h[] 00000 


struct socket 


{ 





























socket state state; 
unsi gned | ong flags; 
struct proto_ops *ops; 
struct inode *1 node; 
struct fasync struct *fasync list; /* Asynchronous wake up list */ 
struct file *file; /* Hle back poi nter for gc * 
struct sock *sk; 
vait_ queue head t wit; 
short type; 
unsi gned char passcred; 
L 
በበ ገኋኋጠበ በበበ በበበበበበበ፲በ בםםםםםםםםםםםםםםםההה א‎ 
U DD DDD DDD DDD 50ቹቨ O00 OQ include/net/sock 8 D D D 0 8000000 
0000000 הפא‎ socket 0 0 D 00 0 0 0 0 D 0 באפ‎ D sk] D sock l 
U D D DD socket D DDD D 0 0 BDsocket 00000 seck DUD 0 DD D D 
בםםםםםםםםםםםםםםםםםםםםםםםם‎ sok0 D DU ቨ በ sock[| 
בםםםםםםםםםםםבםםםםםםםםםםםםםהם‎ proof 0 0 0 DOO Usock 
םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ TOI sock [0000 
םםםםםםםםםהם‎ 0000000 
מםםםםםםםםםהםהםםםםםהםם םםהםםםםהםהםהםםםםםםםםם‎ 
םםםםםםםםםםםםםםםםםםםםםםםםםםהםםםםםםםםםםםםםם‎ 
בםםםםםםםםםםםםםםםםם‎ sockadr סםםםםםםםםםההה‎ 








incl ude/ 1 i nux/ socket. hq] [| 
struct sockaddr { 
sa famly t sa famly; /* address famly, AF xxx */ 
char sa data[ 14]; /* 14 bytes of protocol address */ 


በበ ጊዲ በ በበበ  በበበበበቨበበቨበበበ በበ በበበበ[በበበ[ PPODO 
U U DDD 0 D 00 0 DD D D 0 0 0 D D 0 0 0 ההא‎ 00 D 0 D 0 0 
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BSD DD 00000 DDD D 0000 DD 0 U‏ בהאתפםםםםםםםםםםםםם 
PSD D 00000 DD DD 000 DD 0 U‏ בםםםםםםםםםםםםםםםםםםם 
םםםהפא םםםםםםםם 
םםםםםםםםםםםםטםםםםםםםםםםםםםםםםההפא מםםםם 
מםםםםםםםםםםםםםםםם 
inet pote 000 0 DD 0 U‏ םםםםםם U DUDU 0 D‏ 


incl ude/ net/ protocol H 
struct inet protocol *inet protos[ MX INET PRICE]; 























/* This is used to register protocols. */ 
struct inet protocol 


int (*hand er) (struct sk buff *skb); 

voi d (*err handler)(struct sk buff *skb, u32 info); 
struct inet protocol *next; 

unsi gned char prot ocol ; 

unsi gned char copy: 1; 

voi d “dat a; 

const char *nane; 


L 

OOOO0000000000000000000000000000000000 
OO0OO000000000000000000000000000000000000 
OO0OOO0O00000000000000000000000 


12.3.4 socket [][] 000 


00000 129000 socket 00000 
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socket 





socket 


bind 


connect 











0000 





accept 








server [] [] [| socket client [] [] [] socket 
0 12.9 socket [] [] L LI [] 


1000000 


116[] ] በ socket ON D DD 0 0 0 DDD D D 0 D 0000 DDD D D 0000 U 


DU D DDD DD DDD DDD 0 0 0 net/socket. ch [| 
asnhi nkage long sys socket(int famly, int type, int protocol) 
t 
int retval; 
struct socket *sock; 


retval = 500% create(fanily, type, protocol, Ssock); 
if (retval <0) 
goto out; 


retval — sock nap fd(sock); 
if (retval < 0) 
goto out_rel ease; 


out: 
/* It nay be already another descriptor 8) Not kernel problem */ 
return retval ; 


out_rel ease: 
sock rel 0850) sock) ; 
return retval ; 


} 
U U U U D 0000000000 U DU U D U 0 U DU 0 0 U 0 0 0 U U 0 0 U D U 


s4572 
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OOO000000000000000000 sockfs] D O D 0 net/socket. d 


U U U U U 


[] 
U U U U 
[] 




















U U U prot 


[] 
[] 


U U U U 
OOOO pr 


[] 
[] 
[] 
[] 
U 
[] 
0 
0 


0 





OOO000000000000 sock create D [ D በ በ 
בםםםםםםםםםםםםיםם"‎ socket DUU sok[ ND 


BSD socket HD 0 11110 1010 10 10010 0000100000 [0 
oto ops U [] U D] D] U 0 U 

መ D D D D D DDD DDD SAK ፳ሌብ] SUK DRAM [] 
ops U UD D B] ገበ D] U D] U B. D]. U D. D]. U HE UD በ በ U 

0000 fad000000000000000000000 filed 
በገበበበበበገበበበበበበበበበበ BOP DOC 
000000000000 0000000000000000000 
U 0 DDD 000000000000000 210000 
ocket ה‎ D D sok] D D DD D D 0 0 0 0 D 00 በ በ socket [1 0 D 0 U U 
OOO הא‎ 00 DD DDD 0 D 0 0 D 00 0 DO D 00 DOD D D 


U U U 
U U U 
U U U 
U U U 
5 


[] 
U U 














U U 
U U 
U U 


struct inode [J 


union { 
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) 


struct socket 


static struct vfsnount *sock nmt; 
static DECLARE FSIYPH sock fs type, "sockfs", sockfs read super, FS NMIN), 


kemromiOQOOOOOOOOOOOOOO U U‏ םםםםםםםםםםם 
vfsnount D D D D D D 0 D 0 D 0 0 D D D sock mt D D D 0 0 0 0 D‏ 
)p0000000000000000000000000000‏ ה U D D DU በ፲‏ 
U U‏ 
U U‏ 


socket i; 


[] 





D U 











U 











U U 


socket [] 
U U U 


U U U U U U 


U U 

















U D D DD D 0 0 DDD DD D inedeQ D D D D mim [000000 
ה ם‎ DL UD DD D] 


















































file_struct 
count 
close on exec 
open fs 
fd[0] file 
fd[1] 











BSD 0 D 
00000 








lseek ioctl 
read close 
write fasync 
select 


fd[U] f count 


f inode 


T version 





O 12.10 socket 0 0000 inode[] OOO 


00000 socket | D O DD rode! [0000 wienn בה‎ D D D DD inodeQ n ü 
U U 0 D 0 0 0 0 0 0 D D 0 0 0 U 0 D መመበበበበበበበበበበበበበበ[በ[[ 
בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ socket DO 
OO00000000000000000000000000000 א‎ [000000 
OOO00000000000000000000000000000000000 


20 0 INT BDOANOONOD bind] DO 


U D D D D Internet DD 0 00 000 D D D D 0 0 0 00 INT BONO 
OO0000000000000000000000 [1ሀ.መበበበ00[00[0000[0 TP 
OO בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהּז‎ 
000000000 socket D D 0 0 0 D D D D D TP acHp D 0 0 DUU D sockaddr 


(PPOOO0O000000000000000000000000‏ םםםםםםםםםםם 
בםםםםםםםםההצ בםםםםםםםםםםםהש םםםםםםםםםםם 
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OOOO ifcafigOOOOOOOOOOOOOOOOOOO IPOOOOO sock [| 
0000 rev saddr [ sadr D 0000 D D D D 0 0 0 D D D D D D 00 LPD 00 U 
U U 0 U D 00 000000 D U DU 0 U D U 00 0 UD 00 0 0 00 U 

INTO 0‏ םםםםםםםםםםםםםםםםםםםםםםםםםםםם 
םםםםםםםםםםםהל O000000000TPQO0000000000000‏ 
םםםםםםםםםםה ה OOOO socket/sock] 0 TPOOOOOOOOOOOO‏ 
OO00000000000000000000000000000000000 sock U‏ 
םםםםםהש 000000 




















ቭ] 0 INET DO [] 


U U 

በበበ] 0000 000 U DU 0 U DU D U DUD 0 000 U 
DOO0000000000000000000000000000000000000 
םםםםםםםםםםםםםםםםםםההפאצא בםםםםםםםםםםםםםם‎ 

OOO000000000000000 B® socket 000000 






























































TP 000 30 700 00000000 12.20 ——0 0‏ םםםםםםםםםםם 
TP sock 0 DDD 0 D 0 D D D D sek D 000 U‏ םםםםםםםםםםהםם 
tcp listening hash D 00000000 000000000 sok 0000 D‏ 

MOOO listen] INT 7 

U U U U D U D 0 0 0 D 0 0 0 00 U D U D 0 0 U D 0 0 0 0000 0 00 0 DU U 
O0O000000000000000000000000000NMOOOO000000 


OOO0000000000000000000000 socket DDD D D D TO? [STEN] 
םםםםםםםא םםםםההשדםםםםההש ד םםםםםםםםם‎ 
םםםםםםםםא בםםםםםםםםםםםםםם‎ IUP D 0 D D 0 bottomhalf 
בםםםםםםםםםםםםםםםםםם‎ sk hatt D 0 0 0 00 0 D D sock Du n 
receive queue N D D D 0 0 0 D D D D D D D 0 sk buff D D D D D 0 sode D U 
U uuu 


5S] 000000 [] accept] 


socket JI II DON socket OOOO‏ בםםםםםםםםםםםהםםםםם 
OOO0O000000000000000000 :NrOOOOOOOOOOOOOO‏ 
TPOI00000000000000‏ םםםםםםםםםםםםםםםםםםםםם 
U U 0 U D 0000000000 U DD U D U 0 U D U 0 0 0 000 0 00 0 00 U‏ 
U D D D D socket [00000000000000000000000000000‏ 
ኾመ[00000000000[00.ቨ‏ םםםםםםםםםםםםםםםםםםםםםםםם 
skbffOOO000 TPOOOO sockD DD DD D D INTI‏ םםםםםםםםםם 
D D 0 0 0 D D DD socket [|‏ ה በ D D [00 0 0 Dsoc D D 0 D 0 D D D D D D‏ 
U DD DDD tdn DDD DD DD 0000 DD DD 000000 DD DD 000000 U‏ 



































































































































OO INT SD D D 0 D D D 0 0 0 0 0 ቨ 


החהםההההה ההא 12.3.5 


socket D D D D socket DD DDD 0 D DD DD D 0 0 DD DDD 000 D 0 U 
םםםםםםםםםםםםםםםם‎ 125000 


0 5 socket ה‎ OOO 
U ם‎ በ1 [ U U 








Accept | | | | | | | TOOOOO dguuu 








Bind U U D 0 D D 0 D 0 U 








Connet 0000000 








Get peernane 








Gt socknane 00000000 








Get sockopt U U D 0 D 0 DDD D [ 








Listen |10[[0[[ 






























































Sendt o 00000000 








Set donai nnane 


Set host i d ገበበ11[1[0[0[] 




















Set host nane 000000000 








Set sockopt 0000000 
Shut down Bm 
Socket U U D 0 D D 0 D በ [ 























Socket cal I ገበ] [በበ በበበ 






























































Socket pai r 000000000 








124 DDD በ D sk buff 


በገ U D U D 0 0 0 D 0 0 0 0000 00 0 0 U DU 0 0 0 000 0 00 0 00 U 
በገ በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
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U U 0 U D 00 0000000 U U DU U D U 0 0 0 U 00 0 00 0 0 0 0 D U 0 U D U 
U U 0 00 U 














1241 000000000 


U U U U D U D 0 0 0 D 0 0 0 0000 U DU 0 U D U D U 0 000 0 00 000 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
םםםםםםם‎ 1211000000 





000 0000 
0000 0091 1000 
un טק‎ 7888888891. nop 
10000008008008008 00 ጾ===800800800800800]000 
0000 mi 0000 





በ] 1211 [00000000 
O0O0O00000000000000000000000000000000 















































00000000000000000000000000000 Dam D DD DD 
U U UU U 

















1242 000000000000 


O0O0O0O0000000000000000000000000000000 
00000 sk buff head ה‎ D 0 D D 0 D 0 D 0 D D 0 D DDD 0 D 0 DD D 0 0 
םםםםםםםםםם‎ 100000000000000 20000000000000 


Oo 
בם בם‎ 


U U 0 U 0 U 0 0000000 U DU 0 U D U D U 0 U D 00 0 000 0 00 U 


[] 
በገ] በ U U D 0 0 0 0 U 0 0000 000 U D 0 0 U D U D U 0 0 D 00 0 000 U 





























U U 0 U D U 0 00 000 U DU 0 U D U D U 0 U D 0 0 0 0 000 0 0 0 0 DU U 
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DOO0000000000000000000000000000000000000 


מםםםםםםםםם 
void append frane(char *buf, int len) 1‏ 
*אםםםםםםם\ struct sk buff *skb=alloc skb(len GP ATMO;‏ 















































if(skb—NII) 
ny dropped; 
el se 1 
kb put(skb, len); 
nencpy(skb- >dat a, data, 1 en); I D D DDD DD X 
skb append( Say list, sky; /*000000000000% 
T 
voi d process frane( voi d) I 
struct sk buff *skb; 
while((skb-skb dequeue( &y 115%(( | (11א=‎ 
1 
process data(skb); /ገበበበበበበበበበበ 
אםם‎ 
kfree skb(skb, FREE READ; /ገበበበበበበበበበበበበ” 
› 
› 
በገ] 000000000 በበበበበበበገበገበበበበበበበበገበበበበበበ[በ 
በ] D D በ በ] D append frane( 10 D D D D D D D D D D D process frane( )[ [| 
U DD DDD DD DD DDD DDD DD 00 DDD D D DD D D በ በ nt/coredev.c [ 
netif rx( OOO net bk 10 0 0 D 000 0 0 D 0000 0 0 D 00000 0 DD 0 U 
U D D D 0 0 D D D UD 0 0 D 0 D 0 D 0 D 0 0 0 0 D 00 0 D D D 0 0 D D D 0 0 D 0 U 
U D 0 0 0 D D 00 0 D 00 0 U 
0000000000000 — append frane( ) በ alloc sk ) 000000 
OOO Len םםםםםםהה‎ 12.12 (0 00 0 0 0 D 0000 D 0 DD D 











מםםםםםםםםםםםםםהםם. 

e [00000000 

e J000000000000000 

በ skb ott 10 0 DDD 1212 (9000000000000000000000 
U D D D D D 0 00 DD DD 0 DU mmm 10 0 0 D DDD D 

U U U U D U D 0 0 0 D 0 0 D 0 0 D D U D 0 0 U D U 0 0 0 0 0 0 U 0 0 0 U D U 
U D D DDD 00 DDD DD skb reserve( םהה(‎ 12.12 (BID DD 00000000 


O00000000000000000000000000000 
skb=al 1 oc skb(lendheadspace, GP KERNI); 


skb reserve(skb, headspace); 

skb put (skb, len); 
nencpy_fronfs(skb- “data, data, len); 
pass to mprotocol (skb); 


በ 12.120 000 DD DD 00000 D sk buff 000000 
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(a) alloc sb] O00000 


0000 0000 


(b) alloc reserv 7 ה‎ U H Ú 


U U 
0000 OO0d 


(c) sk buff] U HD] D. B DD 


(d) skb put] OO D 0 D 


0000 = 000 UD DDD 


(e) skb push [] [] 0000 


0000 ₪ 0000 


(f) %ኮ pull [] OO 1] Ú 
[| 12.12 sk buff החחההה‎ 



































12.4.3 sk biffGOOO00000 


sk buff םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהה‎ 


DD D D D በ incl ude/ 1 i nux/ skbuff. hf] [|‏ םםםםםםםםםםם 
struct sk buff +‏ 
These two nenbers must be first. */‏ */ 


struct sk buff * next; /* Next buffer in list*/ 
struct sk buff * prev; /* Previous buffer in list*/ 
struct sk buff head * list; /* List ve are on */ 
struct sock *sk; /* Socket ve are owned by */ 
struct tineval stang; /* Tine ve arrived */ 
struct net device *dev; /* Device we arrived on/are leaving by */ 


/* Transport layer header */ 
uni on 
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struct tcphdr “th: 

struct udphdr “uh, 

struct icnphdr Xi cnph; 
struct ignphdr Xi gnph; 
struct iphdr *i pi ph; 
struct spxhdr  *spxh; 
unsigned char “ray 


th 
/* Network layer header */ 
uni on 
{ 
struct iphdr * ph; 
struct ipv6hdr Xi pv6h; 
struct arphdr *arph; 
struct ipxhdr  *ipxh; 
unsigned char *raw 
} nh; 
/* Link layer header */ 
uni on 
{ 
struct ethhdr  *ethernet; 
unsigned char “ray 
) nac; 


struct dst entry *dst; 


/* 

* This is the control buffer. It is free to use for every 

* layer. Please put your private variables there. If you 

* want to keep themacross layers you have to do a skb clone() 
* first. This is owned by whoever has the skb queued AIM 


#[ 
char ch 48]: 
unsi gned int len /* length of actual data*/ 
unsi gned int data len; 
unsi gned int csum /* Checksum */ 
unsigned char ^ unused, /* Dead field, nay be reused */ 
cloned, /* head nay be cloned (check refcnt to be sure). */ 
pkt type, /* Packet class ” 
ip sunmed; /* Driver fed us an IP checksum ” 
__u32 priority; /* Packet queueing priority */ 
atomic t users; /* User count - see datagramc, tcp.c */ 


unsi gned short protocol; /* Packet protocol fromdriver. */ 
unsigned short security;  /* Security level of packet */ 


unsi gned i nt truesi ze; /* Buffer size */ 
unsigned char *ከ66ቧ /* Had of buffer */ 
unsigned char data; /* Data head poi nter 
unsigned char “tail, /* Tail pointer 
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unsigned char *end; /* End pointer */ 
voi d (*destructor)(struct sk buff *); /* Destruct function */ 














} 
213000 םםםםםםםםם 





true 














በ 12.13 sk buff 0 D 


OO skbffOOOOO00OU040000000000000000 4000000 
OOO0000000000000000000400000000000 
head] 00000000000000 sk buff D D D D 0 0 00 DD DD 0 000 U 
D BUD 
data በ በ 0 D D 0 DD 000 D 0 DDD 00 D 0 0 D sk buff 000000 
U U U U U 
tall D 0 D 0 DD DD 0 D 0 DD 00 data JOOO0O00000000000 
sk buff D D D D D D 0 0 0 DD 
end] D D D D D 0 0 D D 0 D D 0 head 0 0 D D 0 sk buff D D D D 0 0 D D UD 
U U U U DU U 
sk buff D D D D D D D 0 D םם‎ 01መዉ 0 הפ‎ 0000000000000 
U U U UD D U 0 00 U D 0 U 






































1244 00000000000 


1000 sk Dutt DD D D Ú 


sk buff םםםםםםםםםםםםםםםםםםםםםםםםםםםםהה‎ prev [J 


next D 0 D D D D D D D 0 0 D 0 D 0 D D D D D U 
struct sk buff *5 dequeue( struct skb buff head *list) 
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000000000 10000000000000000 םםםםםםםש%‎ 
D 0 D 00 D DDD DDD DD skb queue head [| skb queue tail [] (] 0 D Ú 

int skb peek(struct sk buff head *list) 

10000000 םםםםםםםםםם 

int skb queue enpty(struct sk buff head *list) 

U U D 0 D 0 D true [] 

void skb queue head(struct sk buff *skb) 

U U D 0 D በ 0 D 0 0 D 0 D D በ በ በ 

void skb queue head init(struct sk buff head *list) 

OOO sk buff head D 0 םםםםםםםםםםםםםםםםםםםםםםםםהם‎ 
utu 
u32 skb queue len(struct sk buff head *list) 
O00000000000000 
void skb queue tail(struct sk buff *skb) 
OO000000000000000000000000000000000000 
void skb unlink(struct sk buff *skb) 
O000000000000000000000000000000000000 
OOO00000000TØE00000000000000000000000000 


በገገ]በበበ በበበ DD 00 D D D 0 D D UD 
void skb append(struct sk buff *entry, struct sk buff *new entry) 


void skb insert(struct sk buff *entry, struct sk buff *newentry) 
U U D U 0 D D 0 D D D 0 D D D D D D D D D 0 0 D U 


2J000000000000000 


OOO000000000000000000000000000sk buff OOOO 
U U D 0 D 0 D D D D D D D 0 0 D 0 D 0 0 0 D D D D D 0 0 0 0 D 0 D 0 D D D D D U 
םםםםםםםם‎ 

struct sk buff *alloc_skb(int size, int priority) 
በበበበበበ sk buff 0 D 0 0 D DDD D 

void kfree skb(struct sk buff *skb, int rw 

D D D skb buff] 

struct sk buff *skb clone(struct sk buff *old int priority) 

OOOO skbffoOO0000000 

struct sk buff *skb copy(struct sk buff *skb) 

000000 sk br 


S00 sk buff 0000 D D D D 000 U 


000000000 פבשםםםםםםםםםםםםםםםםםםםםםםם 
(skb- data) ] 0 D 0 D DDD D 0 D 0 0 D 0 D 000 DDD DD 0 0 0‏ 000000 
unsi gned char *skb headroonfstruct sk buff *skb)‏ 


በ0 skbff000000000000000 
unsi gned char *skb pull(struct sk buff *skb, int len) 
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OOOO data000000000000000 led 0000 DDD D 0000 U 


U U D 0 D 0 D D D D D 0 D 0 በ በ 
unsi gned char *skb push(struct sk buff *skb, int len) 


OOOO םםםםםםםםםםםםהה‎ 0 len 0000 DD DD 0000 U 


U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D 0 0 U 
unsi gned char *skb put(struct sk buff *skb, int len) 


OOOO tal 000000000000000 םםםםםםםםםםםםהפו‎ 


U U D D D 0 0 0 0 0 D D D D 0 0 0 0 D 0 D 0 0 U 
unsi gned char *skb reserve(struct sk buff *skb, int len) 


መጩክ 000000000‏ בםםםםםםםםםםםםםםםםםםםםםםם 
U DD 0000 DDD skb mush D D 0 0 0 DDD DDD 0000 DD D DDD DD 0 0‏ 


U D D D 0 D 0 በበ በበ D D 0 D D 0 D D D 0 D 0 0 D 0 0 D D D 0 D D D 0 0 D D 0 0 D U 
unsi gned char *skb tailroonistruct sk buff *skb) 


OO skbffOOOOO000000000 
unsi gned char *skb trintstruct sk buff *skb, int len) 


OOOO םםםםםםםםהםם*ת‎ tal בםםםםםםםםםםםםםה‎ leng 
O00000000000000000000000000M000000000" ler 
*םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ le" 000 






























































1245 0000000000000 


U U U U D U D 0 0 0 D 0 0 0000000 0 0 U DU 0 0 0000 00 0 0 DU U 
U U U UD U U D 0 0 0 በበበ 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 
U U U UD U U D 0 0 0 0 U 00000000 U DU 0 U D U 


sock queue rcv sko] D D D D D D 0 D 00 D 0 DD 0 D DDD DDD D 00 D 0 
sk-ny find socket ( what ever); 
if(sock queue rcv skb(sk, skb) = 1) 
t 


nyproto stats. dropped; 
kfree skb(skb, FREE READ; 
return; 


በገ] በ D U D 0 0 0 D 0 0 0 00 DU U D U 0 U D U 0 0 0 000 0 00 0 U U U 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U D U 0 U D 0 0 0 U 
0000 TW) D DD NOON NDN NONONO NO PONDO 


U D [ በ 0 0 0 sock alloc send so] [ 00000000000, 000000 
U U U 0 0 U DU 0 U D U D 0 0 U D 0 0 00. 00 0 D U 0 U D U DU 0 U D 0 0 0 U 
U U U U D U D 0 0 0 D 0 0 0 0 0000000000 00 U 


U U D 0 D 0 0 D D 0 D 0 D D 0 0 0 D 0 D 0 0 U 
skb=sock alloc send skb(sk,....) 
i f(skb=NII) 
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return - err; 
skb- >sk=sk; 
skb reserve(skb, headroon); 
skb put (skb, len); 
nencpy(skb- “data, data, len); 
protocol do sonet hi ng( skb); 


በበ1]በበበበበበበበበበበበ[በበ[በበበ[ በ በበ skb >sk=sk] sock alloc. 
send skb] D D D D DD 00 D 0 0 0 00000 0 skbs 000000000000 
OOOO kree sko] NON D 0 0 00000000 DD 00 DDD DDD DDD 0 D D 
U D DD 0 0 D DD 00 DD DD D D D በበ 0 D D D D D D D 0 D 0 D 0 D D 00 በበ; 
በበበበበበበበበሀበበበበበበ[[በ kresb D 0 0 D 0 D D D U 
sock alloc send skh] [| [J 


125 [1 [] [1] [] H 


םםםםםםםםםםםםהההאתם 0000000000000 האתגם 

በገ] U U U D 0 0 0 0 U 0 0000000 U D 0 0 U D U D U 0 0 D 00 0 000 U 
U U U U 110 D 0 0 0 0 U 00000 000 U U 0 0 U D U D U 0 0 D 00 0 000 U 
DOO00000000000000000000000000000000000 CD 
000 G4H100000000 
OO drivers/net/skeleton c D 0 0 0 0 DD D D D D 0 D 0 0 D D D D 0000 U 
OOO0000000000000000000000000000000 



















































































125.1 OOOO 


OO 12.14000000000000000000000000000000000 
OOO0000000000000000000000000000000000000 
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U U 


U U 
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U U U U D U D 000 U 


125.2 OOOO 





























0 1214 Unx 00000000000 


םםםםםםם 


OOO0000000000000000000000000000000000000 
OO0O0000000000000000000000000000000000000 
netif rx ( 10 I000000000000000000000000000000 
O0O00000000000000000000000000000000000 
O0O00000000000000000000000000000000000 














በበበ Enx]0000000000000000000000000000000 
OOO00000000000000000000000000000000000 
O00000000000000000000000000000 00000000 
O0O00000000000000000000000" eth በ” ethi” []" eth2” 
0O0000000000000000000000000000000" 00000 
U U 0 U D U 0 0 0 0 DU 0 0 0 U 0 0 0 0 0 0 0 0 O00000000000000 


מםםםםםםם 

םםםםםםםםםהםםםהםםםםם 

ethn 000000000 10nbt/s[] 100Mit/s 
trn U U 0 0 U 

sln መበገ በገ ንበ በበ 4AX25 השא‎ 
pppn PP D D D D በገ 0 0 000 0 0 D 0 0 00 U 
plipn PIP0: OOO000000000 

tunln I PIP encapsulated tunnel s 

nrn Nt RM OOOO 

isdnn ISNOO UD isdn4linux[] 

dunnyn [] H NIL devi ces 

10 OOOO 
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12.5.3 4] 000 


U U D 0000 00000 00 0 00 00 0 0 0 0 0 0 0 D 0 0 0 0 D 0 0 0 U 
register netdev(struct device*) D D D 0 D 0 D DD D D 0 0 0 0 D 0 D 00 DDD 
U DU UD 0 D 0 0 0 D 0 D 0 D D 111 0 D DUD D D 0 D 0 D DD D D 0 D 0 D 0 U 
000 unregister netdev(struct device *) 0000000000000000 
U U U D 0 D 0 0 0 D 0 U 

OOO0000000000000000000000000000000000 
struct devi ce “dev get(const char *nane) TO 000000000000000 
U U U D በበ በበ በበ በ በበበበገበበበበበበበበበበበበበበበ;በበበ[ 
[|] unregister netdev] ] 0 0 D 0 D D 0 D በ] በ D DI 
LU 


U D D 0 D 0 D 0 0 0 D D D D D በ 
int register ny devi ce(voi d) 
t 

int i ©; 

for(i =; i 100; i +) 

t 































































































spri ntf ( nydevi ce. nane, "nydev%", i); 
if(dev get(nydevi ce. nane) =N ID 
1 


if(regi ster_net dev( Snydevi ce) ! =) 
return -HQ 
return 0 
} 
} 
printk("100 nydevs loaded. Unable to load nore. 4V 2n"); 
return - ENILE 
} 


12.54 00000000 


መ መጩበበ[ሀበበሀዐበበበ0880890ሀ00080 Umeg JU D D‏ בםםםםםםם 
BUD include / linux / netdevice.h 000000000000‏ םםםםםםםםם 
U U U U U U D 0 0 0 0 U 00000 U‏ 

U U U U D U D 0 0 0 D 0 0 000000 DU 0 0 D U 0 0 0 000 0 00 0 U UD 
U U U UD U U D 0 0 0 በበ 0 0000000 00 0 U D U 0 U D U D U 0 U D ከፒ 0 U 
U U U 


10 0 0 


nang D D 0 0 0 0 D 0 D 0 D D U D 0 0 0 0 0 0 0 0 0 U D 0 U D 00 00 0 0 U 
O0000000000000000 ጩበበበ080 linx20 000000000 
dev nake nane("eth") 000000000 
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2000000 


O0O00000000000000000000 
םה‎ D D D D D 0 0 000 DD LRH DDD DD 0000000 DD 000000 U 
በበበበበበበበበበበበበበበ םםםםםםםםםםםםםםםםםםםםםש‎ 
האוםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
"םםםםםםםםםםם‎ insnod nydevi ce irg5 םםםםםםםםםםםםהה"‎ 
U IOD D D D D D ifcofig םםםםםםםםםםה‎ 
base addr] D 0 0 0 00 D D D D 0 0 0 00 D D LO D DD DDD D 0000 U 
OO םבםםםםםהתםהםםםםנסע בםםםםםםםהםםמנסע‎ GO DD 0000 U 
OOO000000000000 100 D D OG U OD D D 0 0 00 D ifconfig 000 
O0000000000000000000000 ISMO0000000000 
םםםםםםםם‎ device 000000 4000000000000 0 rnemstar 
rnemend ] 00000000  nemstart | nemend DDD DD 0 0 000 D U 
םםםםםםםםםםםםםםםםםםםםםםםם‎ W00000000 
U U 0 U D 0 0 0 0 0 U U 0 nemi [D D 
ana] D D D D D D D 0 0 DAD D D את‎ DU וא‎ 0 0 0000 D D D 0 0 0 0 U 























EI ב‎ FQ 


[] 
t 
[] 
0 


























000000 DAD D D DAD D 0 0 0 D DU 0 0 0 OOOO CD DDD ISO DA 
በበ OGO000000000000000000000000000 םםםםםההא‎ 
U D D D D D deant 
U U U U U 000000000 0000 0 0 000 0 U D 00 U 0 D 0 0 0 0 0 U 
U U 0 U D ND NONONO NDN U 0 0 0 U 00 0 00 0 0 0 0 D 0 0 U D U 
פע םםםםםםםםםםהםה‎ DAD D 00000 DD 00000 DD 000000 0 
U U 


DOO00000000000000000000000000000 
if port] D D 0 0 0 D D D D D D 0 D 0 D D conbo Ethernet boards] 


A) D D 00 U 


U U U U D U D 0 0 0 D 0 0 00000 U D U 0 U DU 0 0 0000 0 D 0 0 DU U 
U U 0 U D 0000000000000 UD bu 

mul] D D 0 D 1 NDN D በ በ 0 በ1 0 0 0 0 0 0 D 0 0 D U 0 0 0 0 0 0 DU bul 
םםםםטםםםםםםםםםםםםםםםםםםםם‎ LHD D D 00 00 0000 000 U 
U uuu 

famly D 0 0 0 DD D D 0 D 0 00 DD DDD FINNQOGOOOOOOOO 















































OOO0000000000000 Dn 0 0 000000000 L 
OOOO בהא‎ 4H DD D D 0 0 
interface hardware type [NN 00 D D D D D 0 D 0 0 00 0 D D D D 0 0 0 0 U 
םםםםםםםםםםהםםההשא םבםםםםםםםם‎ APO D 000 RF700000 
U D DU DD DU D 0 DDD DDD 0 D 0 D 0 D 0 D D D D D D 0 net-tools 
በ O :net-tools] D D 0 D DD D D D D 0 00 DD D D 0 D Hm 0000 DDD D 0 0 









































= ₪ 






































ifcofig D D D D 0 0 D 0 0 D D D D 0 0000 DD D D 0 DUU‏ םםםםםהםםםםם 
/*O D D D D LA RC] Request መጩጩጩኋ5በበበበ[በበበበ[”‏ 


ARPERD NETROMIRPERD EILER 
ARPERD FETHER 
ARPERD AX25 
ARPERD PRONET 
ARPERD GAS 
ARPERD I EFB02 
ARPERD ARCNET 
APD DO 

U Gmx OO 
ARPERD SLIP 
ARPERD GSLIP 
ARPERD SLI P6 
ARPERD CSLI P6 
ARPERD ADAPT 
ARPERD PPP 
ARPERD TUNNEL 
ARPERD TUNNH 6 
ARPERD FRAD 
ARPERD SKIP 
ARPERD LOPBAK 
ARPERD LOCALTLK 
ARPERD METRI CM 


109ክ1/ 5 | 100nbit/s OOOO 
OOO00 WOOD) 

A 25 2000 

PRMet token ring (0000) 
GaosNT (0000) 

802. 2 networks notably token ri ng 
AH net DO 

Frane Rel ay OA 


Serial Line IP protocol 

SUP wth V header conpressi on 
Gbit encoded SLIP 

6bi + encoded header conpressed SLIP 
SLIP interface in adaptive node 
PPP interfaces (async and sync) 

I PIP tunnel s 

18/6 over IP tunnel s 

Frane Relay Access Devi ce 

SKIP encryption tunnel 

Loopback devi ce 

Localtalk apple netvorki ng devi ce 
Mtri com Radio Network 


0000" 0000” O0000000000000000000000000000 
OO mnet-tools] ime 0 000 D DD 0 0 0 D 00 DDD 0000 U 


e add] 0000 IPO ODO 
e pa brdaddrf] 0000000 


e pa dstadd 000000000000 


° pa mask] 0 DO D 
ש םםםםםםםםםםם‎ 


pa alen] 00000000000 +םםםםםםםםםםהל‎ 


4400000 


hard header len 0 D D 0 D D D D 0 0 0 D D D D D D 0 0 0 0 D D D D 0 0 0 0 U 
םםםםםםםםםםםםםםםםםהםםםםהם‎ sk utt DDD DD 0 0 000 DD 0 U 


D D [] D scratch pad] []‏ םםםם 


U 1.2x0000000 0 0 ה‎ D D D D D D 0 000 DD D D 000 0 U 
*םםםםםםםםםםםהם‎ scratchpad ” 000000 D D [ D hard header len 


= - 










































































[ Linux | Ul 
O000000000000000000000000000013xQ0000000 
0000000000 sk tD DDD DD 0 DDD 00 0 0 0 0000000 DD 0 0 
O O scratch pad] םהה ה‎ D D D D 0 124000 skb אפ‎ ) OOO 

0000000000000 dev addr] ኩክዐክዐጩ[ጁበበ 0 D 0 D D 0 D D D D D D 
O000000000000000000000000000000000000000 
D000000000addr 1eQ00000000000000000000000000 
በበበ GOOO000000000000000000000000000000000 
OOOO ifcorfig 0 DD O0O00000000000000000000000000 
O00000000000000000000000000000000000 










































































O0O000000000000000000000000000000000000 
O0O000000000000000000000 
e IP LH D D 0 D 0 0 0 
U 1:8[  IFF האצאא‎ IF (P 0 DD 0 በ በሀበ 0000 DD 0 DOD DO U 
00000000000 IF UW") D D 0 0 D 0 DD 00 D ጩመበዐሀ[ሀሀሀ Bn 00 D 0 U 
O0000000000000 IF 

° IFF BOWOST D 1 D D 0 D 0 D 0 0 

e IFPRG)000000000000000000 

° IFF [OPPA] 0000000100000000 

s IF UI NOX N በ በ 00000000 WPO הפא‎ OO00000 
O00000000000000000000000 

° IFF מאצאא‎ H IFF UT] 

。 TF אא‎ 00000 A 0 D D 0 0 DD 0 D 00 DU00000000 D 00 
DU U [ 0 DD [ ሀ 0 םםםםםםםההההתאאא‎ 


O00000 


00000000000000000 sk buff םםםםםםםםםםםםםםהה‎ 
U D 0 0 0 D 00 DD DD 0 DD 0 0 D 0 D D D D 0 0 D D 0 0 D D 0 D D D D U 
buffs | ] םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
00000 
int ct=0; 
wile(ct > DEV NMBLFFS) 
1 
skb queue head i ni +) 6000- buffs[ct]); 
ct ++ 














} 

O]‏ םםםםםםםם 

םםםםםםםםםםםםהםםהההה ה ה queue len‏ אא םםםםםםםם 
QQ 100] serial lines [| 10 []‏ 
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12.5.5 0000 


U U U U D U D 0 0 U D 0 0 0 0000000 0 0 D U D U D U D U 0 0 0 U 00 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U DU 0 0 U 
U U U [በ U U D 00 U D 0 0 0 0000 U 


טשוםםםםםםת 


int בםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהה‎ 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
U U DU U D 000 00000 D 00 በበበ በሀ D 00 U 0 D 0 0 U 0 00 0 0 DO 
register netdev D D D 0 D 0 D D 0 D D D D 0 0 000 D U 


20 0 [] [] open] 


open [O 0 0 በ በአ በበበ በበበ በበበ 0 0 0 U D U U D 00 00 0 0 U 
dow -api D D D D D D D 0 0 ist QO000000000000000000000 
000000 dev->openQ D 0 00 error 0 0 D D D D D dow] open] 00000 
OOOOO000000000000000000000000000000000 open 
000000 MDIN USE GIN [| 


30 D U D stop] 


close IO OH open በበበበበበበበበበበበበበሀበ[በ[በበ[በ[በ close በ 
000000 00 הפא‎ D D DOD D 0 D 0 00 0 D 0 D 0 0 DOD D 0 dose] በ 
OO MDC WE GINI 0 0 0 D D D D 0 0 0 D D DD 0 0 D 0 D D 00 0 00 close 
U 0 D D ם‎ DD D (O=success)[] 


4490000000 


O0O000000000000000000000000000000000000 
OOO000000000000000000000000000000000000 


dev- hard start ה‎ D D D D 0 0 0 D D 0 D D D D 0 0 0 D sk buff 0 [D 
םםםםםםםםםםםםםםםםםםםםם‎ 1000 dv=besy)JOOOOOO 
0000000000 der busy] 0 D 0000 D D DD 0 D D DDD 0 D 0000 U 
[] 
0 












































U U 0 U D 0000000000 U DU U D U 0 U D U 0 0 0 000 0 00 0 0 bu 
שא םםםםםםםםםםםםם‎ DD D 0 D D D D 0 D D 0 000 D U 
U U 0 U D 0000 U 

U U U UU DN 0 U 0 00000 0 0 U U 00 DD D 2 
dev_kfree_skb(skb, FREE MTB) D 0 D 0 0 0 D 0 0 D 0 00 D 0 0 D 0000 00 0 
OO0O0000000000000000000 
םבםםםםםםםם‎ skbff)0000000000000000000000000 
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0 
U 
[] 
[] 
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በበበበበበበበበበበበበበበበበበበ[በበበበመጪቁጩ፤[ቨ D D D D D ocked] D D D D 


U U 0 0000 U 
AXIDDUD 


U U U U D U D 0 0 00 0 000000 U DU 0 U DU 0 0 0 000 000 0 00 U 


















































U U U በ U D 00 U D 0 0 0 D U 
HU D D 0 U 


U U 0 U D 0000000000 00 0 U DU 0 U DU 0 0 0000 0 D 0 0 DU U 
OO00000000000000000000000000000000 dev alloc skb 
OOO0000000000000sk mf] 00000000000000000000 
U U U 0 U 0 00 00 00 00 U 
skb- protocol D D D D 0 0 0 D D 0 D D D DD DDD DD 000 DD DD 0 D 0000 U 
םםםםםםםםם‎ ske aac. raw] D D D 0 0 0 D D D D D ske pllQO00000g 
בםםםםםםםםםםםםםםםםםםהם‎ ske >k type D D D 0 0 0 00 DD 0 U 
pkt _ 
PACKET BROADCAST LU U U | 1] U U 
PACKET MILII CAST U U U 0 00 U 


L1 








sk‏ םםםםםםםםםםםםם 


OOOO00000000000 dev- 


OOO00000000000000000000000000000000000 
OOO00000000000000000 dev ebuild header( 70 0 0 0 00 D D 0 U 
በበበ N 0 0 0 0 D D 00 0 0 DD 0000000000 0000000 0000 U 
U U U U D 0 U 





በበ በ U UU 000000 0 0 0 U U U 000 D D D 0 0 0 U U U UU DU 0 U 
dev- “hard header( ( D D D D D 0 0 0 0 D D D D 0 0 0 D D D D D D 0 0 0 0 DD 0 U 
םםם םםםםם‎ dev- hard header len] D D 0 HD D D D DD D. dev >hard header( ) 
םםםםםם‎ skb oeh) D D D 0 D 0 00 DD D D 000 0 U 

U U 0 U D 00 00000000 00 0 U DU 0 U DU 0 0 0 00 0 U D 0 0 U U U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
OOO000000000000000000000000000 legth 0000000 
“hard header( ה‎ 0 0 D 0 DD 00 D D 0 U 
በበበበበበ እገ ፒ በበ በበበ 00000 D" 000 0 00 D U 0" השא‎ 
X םםםםםםםםםםםטםםםםםםםםםיםם.‎ 


U U 0 U D U 00000 00 0 U DU D 0 UD U 
























































skb ה‎ 00000000000 OO 








PACKET SELF םםםםםםםם‎ 
PACKET OIHERFCST በበበበበበበበበበበበበ ሀ በበበበበ[በ 


meti‏ םםםםםםםםםםם 


f 


rei 


)D00000000000000000000 


OOO0000000000000000000000000000000000000 
DOO0000000000000000000000000000000000000 
בםםםםמםםם‎ mtif rOOOO000000000000000000000000 
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[] 

OO00000000000000000000000metif 5) DD DD 0000 U 
OOO0000000000000000000000000000000000000 
םםםםםםםםםםםםםםםםםםם‎ der tx queue len 0 0 D 00 D D D D 0 0 0 
םםםםםםםם‎ 00000000000000000000000000000000 
םםםםםםםםפ בםםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
በበ 1000000000 100 000 DD DD 000 DD DD D 0 0 

U U 0 0 0 0 0 D 0 0 Hm 0 0 0 0 D 0 0 0 0 0 0 D 0 0 0 0 D U Dms | 0 0 U 
U U 0 U D 00 0000 00 0 0 0 D 0 U D 0 0 U D U DU D U D 0 0 0 D U 0 0 0 0 DU 
OO0000000000000000000000000004000000 

םםםםםםצםםםםםםםםםםםםםםםםםהההאתע םםםםםםם 

e 00000 

« OOOO 

e 0000000 

e 0000000 


400000000000000000 00000000000000000000 
םםםםםםםםםםהההאם םםםםםםם 

O0O00000000000000000000000000000000000 
OO00000000000000000020222000001023000010240Q000 
םםםםםםםםםםםםםםםםםםם‎ 240000000 125000000000 
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(DUDU 119681 ll l] [| 


በገ በ D U D 0 0 0 D 0 0 0 0000 U DU 0 U DU 0 0 0000 00 0 0 DU U 
U U U UD U U D 0 0 0 D U 0 0 0000000 DD 0 U D U 0 U D U DU 0 UD 0 0 0 U 
DOO DO DD DD 0 RN RCD DOO BGQO0000000B8GQ0000 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
0000i360000000000000000000000000000000 


13.1 DUN 


በበበበበበበበበበበበቨዘሀበሀበበሀበበወኀ9ጩመጩበ[በበበበበበበበበበበበበ[;[ 
U U U UD D U D 0 0 ቨ0 U 





0 131 (0000 


0 8.10000000000000000000000000000000000 
O0000B8G0000000000000000000000000000000000 
00000 BGOQOOOOODOBGQOGOOOD Boot הא‎ 0 D 0 D 0 0 D D 0 U 
U U U በ U D 0 0 U D 0 0 0 0000 U 
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13.11 0000000 


U D D D Intel 386 GUD D D 0 0 0 0 DD D D D 00000 DDD D 000 0 U 
U U U በ በበበ በበበ D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
በበ0[00[0000006መ00[0[0በ00[ ፻80[ቨ LPD 0 D በ D በ 0000010 rn 0 በ 
OO םםםםםםםבםםםםםםםםםםםםםםםהםםםה השא בםםםםה?=‎ 
U0000 םםםםההשא‎ 


13.1.2 H0 [| 


በ በ Basic Input Qtput Systemi [00000000‏ םםםםםםםםההם5א 
במ 0 00 0 በ መበበበበበበበበበበሀበሀበበሀበ በበ በበበ 0 0 0 D DD D‏ 
U U U U 0 00000 0 000 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 U‏ 
U 0 D 000 DDD DDD 00 00 ፐ፲ጋብበበ00000000000 UU FFE: 0000]‏ 
CU] D BORD D D DD 0 NN DDD 00 00 DDD 0000 DDD 000 0 DD D 0‏ 
በበበ 000 0000 0000 0000 0 U‏ 
D በ PET Pover- Self‏ [ 0 םםם םםםםםםםםהםה א םםםםםם 
א 00000000000000000000000000000 Test[] DD OO‏ 
በበ 1] በ በ በበ በበበ DD 000 0 D 0 D 00 0 BROS 0 D 0 D D D D Boot Loader]‏ 
BGO000000000000BGO0000000‏ םםםםםםםםםםםםםםם 
Boot Loader] 0000000000‏ בםםםםםםהםההאאםםת 0000000 
J00000000000000 Bot‏ א השא U D D 000 D 00 OD 0 0 0 D‏ 
Loader[]‏ 
O000000009HG000000000000000000000000000‏ 
በበበ] ገበ ገ ገበ ነመበበበበበበበበበበበበሀበሀሀበሀበበበ[በ[በበ[በበበበበ‏ 
OOOO Hmx[] Botsect. S[ 0 D 0 D 0 DD DD D 0 0 0 0 D 0 D 000 0 DDD D 0‏ 
םםםשא םםםםםםםםםםםםםםהם 
9G0000000000P600000 1400000000‏ 000000000 
በበ 143.1000000 PST 0 0 DD D D 0 0 D 0 D Bot Loader]‏ 
































RTD NOOD 14000‏ 131 ם 
U U U U U U U U U U U U‏ 
ርመ 111010]; 8 U U U U UU U‏ 1 
32K RAM] U [| [| D 9 U U U U UU U‏ 2 
DAT 0 0 0 U 10 U U RU U U [| |]‏ 3 
א 000000000 11 32K RAM] [] 0 [| D‏ 4 
ROOOOOO 12 000000‏ 5 
U U U UU U‏ 13 000000 82590 6 
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7 82531 0 0 0 D 14 U U U U UU UU 000 U 

BOD DDD DDD א‎ D DDD 000p DDD DD 0000 DD DD 0000 U 
םםםםםםרא םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהם‎ 
U U 











13.1.3 Boot Loader 


Poot Loader O 000000000000 MD DD 00000 D D D D 0 000 U 
U U U በ U D 0 0 0 D U 0 0 0000000 00 0 በበ U D U DU 0 U D 0 0 0 U 
U U U [በ በ U D 0 0 0 D U 00 U 
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Bot Loader D D D D D 0 D 00 D D D D 0 0 0 0 0‏ בםםםםםםםםםםםםם 
U U U U U U D 0 0 0 በበበ 0 0000000 00 0 በበ U D U D U 0 U D 0 0 0 U‏ 
א 0 0 DD D 0000 DD DD 0 D‏ םםםםםםםםםםםםםםהםםםםהם 
U U 0000000000000000 000 0 0 0 D D 0 0 0 0 0 D U Line | OD Ú‏ 
በገ በ በ U D 0 0 0 D U 0 0 0000000 000 U D U 0 U U U‏ 


13.2 DUN 


13.21 0000000000 


U D DU 0 0 D 0 0 000000 0 0 0 0 QD 0 0 0 D 0 D D 0 0 0 D D 0 Dom 
U U 0 U D 00 0000 00 D U DU 0 U D U 0 0 0 UD 0 0 0 U 0 U 0 U D U 
በበበ D D Hm 0 D 0 0 0 0 0 0 D D 0 0 0 0 0 D 0 0 0 0 0 በ በ በ 0 D me [| 
U U 0 U D 00 0000 00 D U DU 0 U D U 0 0 0 000 0 0 U 0 0 0 U D U 
OO /usr/ sur/archN 0000000000000000 Intel 380600000 
U D D D D 0 spark DD DDD 0 0 DDD DD DD 000 DD D D D D 0 DU 
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00000 Intel 8386] D D D D 0 0 D 00 D D DD 0 00000 D D D D 0 0 
00000 ה‎ 0 0 D 00 DD D D D D D 0 DD D D D D 0 DU 
በገ U D U 0 00000000 0000 DU 0 0 D U 0 00 U 
U U טימ‎ D 00 00000000 0000 םמ‎ 0 U D U 0 U 0 U 
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םםםםםםםםםםםהה 13.22 


U U U 
በገ U D U D 0 0 U D 0 0 0 0000000 0 0 D U D U D U D U 0 0 0 000 U 
U U U UU U D 00 U D 0 00 D U 














































































































13.3 Linux[] Boot Loader 


Lin 0 0 D 0 00 DD D D D 0 0 D 00 0 Bot Loader] [J‏ םםםםםםםםםם 
O0 Boot Loader D D D D D 0 D 0 0 0 D D D D D D 0 D 0 D D Boot Loader 0 D D D D Ú‏ 
U U U UD D U D 0 0 0 D U‏ 


13.3.1 JO 000 


OO0O000000000000000000 MO הצא‎ Bp] inoden [0000 
O0O0000000000000000000000000000000000000 
םםםםםםםםםםםםםם‎ 120 D 
U D D D D 0 D 0 הש‎ D 0 0 0 DD D DD DD 00 DDD D D D D 0 0000 U 
U U U U 0 U D 000 U 
U U U U D U D 0 0 U D 0 0 0 0000000 0 0 D U D U U U D U 0 0 0 U 00 U 
שש בםםםםםםםםםםםםם‎ D D D D 0 D 0000 DD DD 0 0 
םםםםםםםםםםםםםהםםםהה65‎ 133000 Ex DD 0000 U 
פםםםםםםםםםםםם‎ 













































































































































































[] [ Linux [] [ 
02000 
BET SAT p 
בו‎ 0x003 
| 磁盘 参数 表 
Ox02C/ DxD3E 
代码 部 分 
፳ 据 区 0x1FE 
启动 标志 : 5 
U 132 00000 0133 00000 
13.3.2 [I ul 


ጩመበቨበ000000[0 400000‏ בםםםםםםםםםםםםםםהםםםםם 
D 0 D D O D D D 0 0 0 0 D D 0 D D 0 0 0 0 0 D 0 D 0 0 0 0 D‏ הט በ Pramray‏ 
D HD (Extended Partition NON D 0 0 0 D 0 D D 0 0 D D 0 D D D 0 D 0 0 0 0 U‏ 
በበበበበበበበበበበበበበቨበዘሀበበሀበጩ በበበበበበበበበበበ[በ[በ[በቨ‏ 
B400000000000‏ נבםםםםםםםםםםםםםםםםםםם 
O0O000000000000000000000000000000000000‏ 
OO0000000000000000000000000MRHO0000000000‏ 
135000 00000000 

















































































































TARE 
代码 
分 区 1 
"EC 
4 HER 
扩展 分 区 表 
分 区 3 
启动 标志 DxAA55 
分 区 4 
0 134 (000000 በ 135 000000 


O0O00000000000000000000000000000000000 
OOO000000000000000000000000000000 D500 FASKO 
םםםםםםםםםםםםםםםם‎ active] D 00000 םםםםםםםםהפע‎ 


13.3.3 Boot Loader 


OO0O00000000000B6Q0 Boot Loar N D D D D D D 0 0 0 D D D D MR 
OOO000000000000000000000000 Boot Loader UU Boot Loader 
በ D D 0 Bot Loader D D D D D 0 0 DDD D D D D 0 D 00 D D D D 0000 U 

OOO Boot Loader D 0 0 0 DD D D D D 0 0 0 D D D D D D D UD PÆNE Boot 
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Loader | DSO 0000 M Boot Loader] D D D D 0 0 d D D d D D D D 0 ON Boot 
Loader D D D D 0 0 0 0 0 D D D D 0 0 D ሀ D 0 1780 CN 189 GM [00000 
םםםםםםםםםםםםםםםםםםם‎ IBON D D D 00 D DD DDD 0 00 D 0 U 
0000 Boot Loader D D D D D 0 000 D D D D 0 0 0 D D D D D D 0 0 00 DD 0 U 
U D DDD DU DD DDD NONONO 0 0 DD D D D D 0 D ከ ከ D Boot Loader 
U D D DD 000 DD DD DD 0 Boot Loader 0 0 D D Ú 
םבםםםםםםשע םםםםםםםםםםםםםםםםםםם‎ A000000 
םםםםםם‎ Dm 000 0 00 0 00000 DD 000 D 0 0 0 D 0 D 0 I 0 Dnne [| 
הפו‎ [000000000000—000000000? 
00 Mos] Boot loaderQ D D DD D D D D 0 D 0 0 D D D D 0 D 0 0 0 0 D 0 U 
U U U በ በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
00000 00000 [אמע‎ IAN Dos" D D D 0 LULO0 0 0 0 0 D D 0 U 
U U U በ በበበ በበበ D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 [ 
00000 Boot Loader 0 D D 0 0 D D D D 0 0 D 0 0 D D D D 0 0 0 D D U LOD D D Ú 
בםםםםםטםםםםםםםםםםםםםםםםםםםםםםםםם‎ HI 













































































13.3.4 LILO 


U LO) D D D Enes 000 0 Boot loaderQ UD 0 D D D D D D D 0 0 0 Lin] [H 
בםםםםםםםםם‎ Hn 0 0 0 0 0 D 0 0 0 0 0 D Lin DQ 0 0 0 U 
U D D 0 D ם‎ በበ ዉጩለፍሼጩጩ8በ D 00000000 UmeQ 0 DDD DD DD 000 0 U 
U D D D D MB D D D D Boot Loadr 0 D D 0 DD 0 0 0 0 DD D D 0 D 0 0 0 0 0 0 U 
U U U UD U U D 0 0 0 0 U 00000000 U 

0100000000 58000000 
םםםםםםםםםם‎ DBI000000000 13 6000 






































U U UU 0 11 D 1 0 0 U U U U 
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0137 D IONN ST D D 


Domm D DD 0000 DS 00000000000000000000000000 
00 DSO D D D D Autoexec. bet 0 D D በ Loading תה‎ 
0 3 ULOD D D םםםםםםםםםהםהאתם‎ 13.8000 


0000 םםםםםם 00000 


ME SEE uw | 


በ] 13.8 [1[1 D 0 םםםםםהההאתתם‎ 


OOO0000000000000000000000000000 mxg00000 
Dot D D D D D D D D Wndownn O00 Wndow D D D 0 0 0 0 DD U 
םםםםםםם‎ WndowQ 0 D 00000 D D D D 0 D 0 0 D D DD 00000 D D 0 U 
U D D D D 0 00 DD D 000 האש‎ D D 0 0 0 00 D D D 0 0 0 D DD D n በበ 
00000 05622) 000000000000 האש‎ 0 0 0 ULO] 0 0 0 D D 0 U 
U D D 0 D OO UO) DD 0 D D D D 0 D 00 D D DD D D 0 0 0 Dms D 0 D 0000 U 
OOO000000000 1390 D D 


0000 םםםםםם 00000 




















| com 
MS-DOS 
一 > LOADLIN œ Linux 


U 139 בםםםםםםםםםםההסע‎ 


lime |] A000 000000‏ םםםםםםםםםםםםםםםםםםם 
D [ D D autoexec.bat N 00 LONDINI NO D ne [] D U‏ םהה האפם 0 0 U D D D D‏ 
980000 םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםנםםם 
ULOD D D D D 00000 U‏ םםםםםםםםםםםםםםםםםםםםםםםםםםהם 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
በበበበበበበበበበበበበበ 6nxJQOO00000000‏ 

49 U LOD D D D 0 0 0 0 DD 0 U 

OO 13100 00 0110000000 ME D I 0 Bot loaderQ בה‎ 
በበበበበበበበበበበቨበዘበበበበበ MO 0000000000000000 00 U 


-483-- 





L1 












































Ol Linux [ ul 














U U 0 U D 0000 U 


0000 םםםםםם 00000 


E O L3 בם‎ ጩ בם‎ 
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O 0 





Ek E=] El AGA 
ET EL EI Br E 


nm 


Oo 
ELE 328 
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[] 


“ Dos" DU Wae ה‎ 00000 60000000" Gox” 0000000 


Linux 


םםםםםם 





ל 
uo | |‏ 

SSS 
AJ 

U 13.10 ULOD 0 00 0 00 0 


יםםםםםםםםםםםםםםםםםםםהחסת 
በ Mp Installer] በበ ULO DD 00 0 0 D D 0 0 0 D 0 D D BOO 0000‏ 
O000000000000000 UO" D 00 D D 00 D 0 D 0 D D D uro‏ 
LH || [[] B. /sbnlilo]] 000 OMpinstaller] 0 000000 Boot loader‏ 
D D D‏ 0 הפ U D 0 D D 0 D ፲ Bot loader 00 DD D 0 0 D 0 0 0 —nap‏ 
O0000000000000000000000000000/sbkwlilog OO‏ 
Bb‏ 
D nme 1‏ םםםםםםםהסע םםםםםההה5א 1000 U Boot Loader]‏ 
U DDD DDD DDD DDD D D D D D D Dnes Bot loader 000000000‏ 

U D D DD 0 D D D D D D D 0 D 0 D D D D D D 0 U 
0 םםםםםםםםםםםםםםם‎ 0 0 MpinstallerQ D | nap[] DO / boot / nan 
םתה תה 111000 ם‎ 0 ሀ /%6/1110. םחתהםההםהסעע 0000000 ה‎ 
U D D D D / boot [] D [I l 
U LOD D | Eng D םםםםםה‎ Ex D 0 0 0 D 00 D 0 0 0 DDD 0 0 HOQ 
טע "םםםםםםההשע םםםםםםםםםםםםםםם‎ 000000 0 
Grl [0 ₪ םםםםםםםםםםםםםהםהםהסע םםםםםהה‎ Tebl | | 
U D D" UTOboot” D D 0 D 0 0 0 0 0 0 0 000 00000 0 D 0000 0 00 0 
*םםםםםםםםם‎ Ome’ 0" DS DD DD DD D D" Dos" DD Dms [| [| 


L1 C0] 























ጥጉን ጠበበበ1000000000ቨ 

U LO boot: Linx 100000000000000 
LI LOboot: Li nux et her-et h0]]0x280|10[] I 00000000000000 [] 08260] 
OO 10] 

ጥጥን በ በበ D D 0 ጩጩ[በበበበበበበበ[ሀበበበበበበበበበ[በ uo 
O0O000000000000000000000000000000000000 
OOO00000000000000000000000000000000000 
OOO00000000000000000000000000000000000 
U U 0 U D 00 00 U 
O0000000000000 0 00 סא‎ 000000000000000 
םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ ₪ NOO, O 
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D D DDD sie t םםםםםםםםםה‎ 


000000 200 2 
# Jetc/lilo. conf 
# 111() confi guration file 
# gernerated by 'liloconfig 
# 
# Start 1110 global section 


























OOOO00000000000* 
boot = / dev/ hda2 
delay = 50 
vga = normal 
# randi sk = 0 
# End HIO global section 
# Linux bootable partition config begins 


XU LOD በ 0 
append = "ether=et h0] [280א0‎ 10" /*7 0 [ ሀ 























Linux [ 


U DD DDD DD DD DD በ 8 lilo. conf [| 





ሣ 


በ U U 
U U U 000000000 000000000 0 


*םםםםםםם 


OOOO 8ዉጩ[በበበበ 


root = / dev/ hda2 ጭሚጩበበበበበበበበ0000 1000000 

i nage —/vnhi nuz /ግ D በ በ በ በ በ vmi mne O00 */ 

lable =limx /ጠበ[000[0000 linux 

inage =/zinage- 2. 4. 18 POOO En] םםםםםםםםםםםםםםםםםםהםה‎ 
000000000000000000000000000000000 ULOD 0 0 ነኝጩበበበ” 


label = Nevkernel 
read- onl y 

#inux bootable partition config ends 
#005 boot able partition config begens 


000000 


*םםםםםםםםםהםם 
/* 0000 האתם*/ 
OOOO ጩመበበበበ”‏ 


other =/dev/hdal /*] 00000 Boot loaderQ 0000 10000000000 


label = dos 
table =/ dev/hda 
# Ds boot ab le partion config ends 


rOOOOD 


13.3.5 111()1 NO OD 


00000 LIO NOOD 


OOOO መሃ 








*םםםםםםו םםםםםםםםםםםם 
*םםםםם Ds‏ 


?םםםםםםםםהת םםםםםםםםם 


Boot Loader‏ םםםםםטםםםםםםםםםםםםםםהנפע םםםםםםםםםהם 


U U U U 0 U D 00 0000 U 
100000 


U U U U U 


H np 1111100800 LABA D D 0 0 D D 0 D D D D 0 "7" 600000" nu 
O0O0000000000000000000000000 
000000 Unuxg [| Boot Loader [] [] D D 00000 arch/i 386/ boot / boot sect. S 


U U U U 0 U D 000 U 














OOO 1000000000 



































ወመ[በበበበበበሀበበበበበበበበበበበበበበ[በ[[በቨ‏ םםםםםםםםםםם 
BaxOOOOO‏ םםםםםםםםםםםםםםםםטםםםםםםםםםםםםםםםם 


םשא 1000000000000000 םםםםםםםםםםםםםםםם 


O D Boot Loader [] [ D D BG] Boot Loader [1 OO O Ú 








00000 0x07c000 D D 0000 Boot Loader] Boot Loader [] [1 0 D D D U 
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000000 0x07c00 D [] 0x90000 
U D D D 008000" DD D" DU 
O00000000000B8GQ000000000000 
OOOO BGOOOOOOO* Leading" OOO 

s 00000 בםםםםםםםםםםהםםםהשא‎ setw 70 DD DDD 000 U 
OOOO O0020000000 

e 1100 BGOO0000000000000000000000000000 
U D D D D 0 00 0100000 0000000000 01000000 D 0 D D DD 0 0 d^ 00 
"םםםםםםםם"ם‎ 61 NA 0 DD DDD DOO "DD 000 00 U 
“ nake bzInage” 0000000 


200000 


O000006ns J0000000000B8GQ0000000000000 
0x00007c00[] [T] O 0 [] D Boot Loader[JBoot Loader] O O O O [| [90000א0‎ [T] [| 0x9B000 
U D D D D D 0 098000 በ ה 2000000000000 00000 ה‎ 0 
םםםםםםםם םםםםםםםםםםםםםםםםםםםםםםםםםם‎ 200 
OO0000000000001000000002000000000000000 
U D 00 D 0000000000 0 U 
םםםםםםםםםם השש בםםםםםםםםםםםםםםםםםםםם‎ 
U D D D D D 0 הפס‎ D D D 0 0 0 0 D DD D D 0 00 DD DD D D 0 0 0 
OOO0000000000000000000000000 090600 0 0 0 O 
OOO000000000000000 098000 በ 
U U D 0 0 D U D 0 U RM D D 0 D 0 0 0 0000000000000 00 U 
OO 1680 D DD D 0 D 0 በ 168 D 0 0 D DD D D 0 םםםםםהשא‎ 16% 
U D DD 0 00 DD DDD 000 4000000000000000000000 
OOO000000000000000 
בםםםםםםםםםםםםםםםםםםם‎ 090000000000000 
100000 00000000 rake ההא‎ D D D D 0 D 0 D D D D D D 03100000 
U D D D D 0 D 0 mo D D D 0 0 0 D D D D D 090000 n 

U D inageQ האתע‎ DDD DD D D I D 0x90200 Setup. S] I D D Ú! 
U D DDD 000 DD :chain loader NANONOOD 0x902000 00 
U D D D በበ [ 0 D 0x90400 chain loader D D D D D 0 D. 0 0 D D ה‎ 0 
U D D D D D OO )00000000000000000 
םםםםםםםםםםםםםיםםםםםםםםםםםםםםםםםםםםם‎ 
םםםםםםם‎ OOO 
p 13.110 מםםםםםםםםםהםםההסט‎ 
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መ [— — wen 
an 263 — ang 
ms 
= s200 
0760 | .-  .- |325K00 
0x10000 mm 4480 በ 
ge Din 


0x90200 395800 00000 2K00) 
Ox9A000 00000 51200 


094201. on - - םםא35|‎ 

0x9B000 8KO OO OOO 25K00 
Lann sang 

D‏ וספ 

Laran sang 

0x9D800 siu 

0x9DA00 IKOO 


oou xon 


በ 13.11 ፲[[ጋ ጠበ 1 0000000000 0 





13.4 [00000 


Poot Loader 0 0 DD DD D D D 0 0 D 00 D D D D 0 0 0 DD DD D D 0 00 0 U 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U D D 0 D 000 ULO) D D 0 D D D D 0 Stop SD D D D DD DD 00000 DD 0 U 
1600000000000000 


13.4. 1 Setup.S 


ooo Setup. 50 0 D D 0 D D DD 000 DD DD DD 0000 DD D D 0000 U 
השא 0000 םםםםםםםםםםםםםםםהם‎ D 00 DD DD 00000 DD 0 U 
000000000000000000000000000 P8200000000000 
386 D D D 0 0 0 DD DDD 00000 DD D D AU000000000000000 
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OOO000000000000000000000000000000000000 3 
בםםםםםםםשםםםםהםםםםהם‎ 220 D D D D 0 0 0 000 D D WO Boot Loader 
0000 םםםהסנם‎ 20000000000000000000000000000 
U U U U D U D 0 0 0 D 0 0 0 0 U DU 000000 ቨ 
000000000000000 האג‎ lgd DDD 000 DD D D Did odd 
U D D D 0 መበበበበበበበበበበበበበበበበ[በበበበበበበበበ[በ 8GJ 000 
N00 gd 00000000004000000000000000000000 400 
U U U U DU U 















































[]1].vwrd 00] 0] 0 000000 הצא‎ 

02].wrd 000] 0 L 00 ET 

[] 30 .wrd OxFFFF ! 4@ [] 0x100000*0x1000 = 400 00000000 
. word 080000 ! base address 
. word ` Ox9A00 ! 000000 
.wrd  ዐኗዐዐ(፻ ![] [] 6 

l ብ] . word  OxFFFF ! 4G] 0x100000*0x1000 =4G D D B B B [ D 
.word 080000 ! base address-0 
. word 089200 LD D D 0 
.word በጸዐዐር፲ ![] D 6 


210000000 םםםםםםםםםםםםםםםםםםםם 

U U 0 U D በ 0 00000000 000 U 

U DD DD 8590000000000000000000000000000 RI 
U U 0 U D U 0 00000000 000 U 
NONONO DD Setup, SD D D D D D 000 0 U 















































U D DDD 000 D Fead SD DD 2000000 


13.4. 2 Head S 


Had SD D D D D 0 D 0 D D D D D D 0 D 0 00 D 0 DDD DD 0 0 000 DD 0 U 
בםםםםםםםםםםם‎ 2600000000000000000000000000 
בםםםםםםההאם םםםםםםםםםםםםםםםםםםםםםםםםםםםם‎ 
םםםםםםםםםםםםםםםםהההאתעםםםםםםםםםםםםםםההה‎ 
U U U U U U D 0 0 0 0 U 00000000 U D 0 0 U D U D 0 0 0 D 00 0000 U 
00000000 BGOO000000000000000000000000000 
በበበ ፳መጩበበበበበ[በበበ008መቨ[[ቨ[0 
በገበበበበበ፲ በበበ በሀበ, 0000 ሀ 
הההםההםםםםםםםם‎ 000 U 
በገ [በ U D U 0 0000000000 U 






































ו 
םםםםםםםםםםם 
U U U U 0 U 000 U‏ 
OO start kernel ()[] [|‏ 












































U U D U 
U uuu 
U uuu 
U U U U 


— 488 - 


Poot Loader O 0 0 D D D D D D 0 0 0 0 DD D D 0 0 0 D D 0 DD DD 0000 U 
O0O000000000000000000000000000ÆdSQ00000 
empty zero page [J0D0000000000000000000000000 
OOO000000000000000000000000000 


Had. 














Start kernel )AOOO00 000000000000000‏ םםםםםםםםם 
80487000000000 808879 םםםםםםםם 
םםםםם--םםםםםםםםםםםםםהםם 

Rad SO D | Setup ה[‎ 00000000000 APBD EIL CO. D D HE DEO. 0 DI 
U UD D D D D start 40 U D (D B D D] D D 1 0 CD. 0 0 D D በ0 በ0 ה‎ 0 
םםםםםםםםם‎ 0000000000000000 00 —svp page Or 
00000 טס 01000 00000000000 כ-‎ D 0000000000 
U D DD 00 D DD D DD 0000 DOD D D 00 D D D D 0 D D 0 D 400000000 
0 Rad ה5‎ D D D በበ D D D D D D D D D D D D D swp page dr] po [0000 
enpty bad page [| enpty bad page table | enpty zero page ם ם ה ה‎ D D D በ 
enpty zero page] ה‎ 0 0 NONONO D D 0 U D 0 U D 0 D U D 0 0 D 0 D 0 D 0 0 [ 

enpty zero page [] ] D D D D D D D D D D D D D D D D D D D በበበ 2KBD 000 





























[ Linux [] [ 




















= 
= 
= 



















































































[] 
[] 
0 
U 
































U U U በ U D 0 0 0 D U 00 U 


U U U 


0 


0000 U U 


32 bytes בםםםםםםםם‎ 


2 “unsigned short EXT MMK] extended nenory size in Kb (HG[ 150 
(םםםםםםםםם‎ 
0x20 


022 


unsi gned short d. MAG] 000000 (=xA335 
unsi qed short  ŒFSET] D D D 0 0 0 D 0 0 0 0 0 0 0 0 0 0 
0x90000 + contents of dA. CFFSET 

(00 G. MIC = ה"‎ D] [] ) 
20 bytes APMHG INO[ OO 
16 bytes hdo- disk- parameter 000 10000 הפשא‎ 40000000 
16 bytes hdi-disk parameter 000 10000 הפשא‎ 46000000 
16 bytes םםםםםםםם‎ 1600000 

( sys desc table struct [ [] ) 


- Oxldf 


000 
unsigned long ALT MMK] D D 0 0 0 00 D 
Char setup. sOOO000 
unsi gned short MINI ROT RONY (if !ጩ 
unsigned short] OOOOO000 
unsi gned short swap dev (unused AIN] OOOO [] 
unsi gned short AMA SK HAS] OO םהה‎ [] 
unsi gned short VGA: Mide 
unsi gned short CH G RAT DEV (hi gh=Mj or] lowminor)[] |] [] [] [] [] 
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0000 
Ox1ff 
08200 
08202 


08206 
08206 
08210 


0x212 
0x214 
0x218 
Ox21c 
08220 
0x224 









































UI Linux [ ul 














char AX TEM CE INO 
short junp to start of setup code aka "reserved" field. 
4 bytes SETU header ] | 0 0 ='Hirs' 
000000 080241... 
unsi gned short header [] [] D 
8 bytes setup. SJ [ boot loaders [] [| OOOO 
Char LOWER TYPE =ጩ 0000000 
000 boot loaderQ 000 
OxTV: TO] LILO 
1 [] Loadin 
2 | bootsect-1oader 
3[] SYSINX 
4 [| EIER 
v=J 000000 
char loadflagsD 1 NOO: 
bito=1: DD D DDD (bzlnage) 
ከ117 = 1: boot loaderQ 0000000 
unsi gned short (set up. S) 
unsi gned long KERNEL STAR] loader [000000 
unsigned long IN TFD SIRI OO 000 inage[] [] D 
unsi qed long INTRO 12 0000 image [] [] 0 
4 bytes (setup. S) 
unsi gned short setup. 5 [] [] [] [] Ü 





08226 - 1 setup.S [] [] 


08800 


string] 2Knax 00000 


O0O00000000000000000000000000000000000 


0x800] 48] [000000000000000000000000000000000 




















OO0000006nsQQ000000000000000000000000000 


OOO000000000000 ה‎ 00000000000000000000 
O0O0000000000000000000000000000000000000 
O0O0000000000000000000000000000000000000 
U U 0 D U 00000000 NLD 0 0 0 0 D 0 D 0 0 0000 U 

Pad 5 0 DD 0000 U‏ בםםםםםםםםםםםםםםםםםםםםםםםםם 
U U U U U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U‏ 
Fad SD DDD DD 000 0 U‏ בםםםםםםםםםםםםםםםםםםםםםםםם 

































































ENIRY( gdt_tabl e) 

. quad 080000000000000000 /* NIL descriptor */ 

. quad 080000000000000000 /* not used */ 

. quad Ox00cf Sa000000f ff f /* 0810 kernel 4(B code at 0800000000 */ 
. quad OxOOcf 92000000f f f f /* 0x18 kernel 4(B data at 0800000000 */ 
. quad OxOOcf f a000000f f f f /* 0823 user 4B code at 0800000000 */ 
. quad OxOOcf f 2000000f f f f /* Ox2b user 4(B data at 0800000000 */ 
. quad 0x0000000000000000 /* not used */ 
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. quad. 0x0000000000000000 /* not used */ 


























[] [ Linux [ 


* The APMsegnents have byte granul arity and their bases 
* and limits are set at run tine. 


























. quad 0x0040920000000000 /* 0x40 APMset up for bad BG s */ 
. quad 0x00409a0000000000 /* 0x48 APMCS code */ 

. quad 0x00009a0000000000 /* 0x50 APMCS 16 code (16 bit) */ 

. quad 0x0040920000000000 /* 0x58 APMIS data */ 

. fill NR 80 /* space for TSS s and IIT 5 */ 


2300000000000000000000 םםםםםםםםםםהםםםםהם 
To lid D D D D 0 D 0 DDD 000 DD DD D D 0 00 U‏ םםםםםםםםםםהם 
U U U በበበ በበበ 0 U 0 0000000 U D 0 0 U D U D U 0 UD 000 000 U‏ 
םםםםםםםםםםםםםםםםםםםםםםםםםהא 000000 





























































































































00000000000000000000000000000000000000 
0000000000000 ከ 0 Hed SQ ሀ /init/nin CO D start kernel 0 0000 
[0000000000 

13.5 nain. C 1] [1] LI Ú 

heads) DL DO 0 0. 0 א‎ 6 D start ה‎ 00 0000000 000 00 
70 0 0 0 start kernel D 000 000 0 000 000 םםםםםםםםה6תא‎ 
O000000000000000000000000000000000 

O0000000000 start kerne 00000000 360000000000 
O0000000000000000000000000000090000000000 
O00000000000000000000000 MMOOOOOOOO 360000 
O000000000000000000000000000000000000000 
3600000000000000000000000000000 3860000000 
00000000 start kernel 0 J0000006ms0000000000000000 
00000 start ጪመ[00000ሀ000000000ሀ0000000ሀ0 ፡መጩመ00 

start kernel 000000 000000 00 DD start_kernelg D‏ 0 0 0 0 ם 
00000000 הא start‏ 00 000 0:0[ 

0000 S900000000000000000000000 start kernel] OO 
[00000000000000000000000000000000000000 
[1:991000000000000000000000000000ሀ00 62000000 
OOOO00 Ostart_kernlQ D ሀ ከ ከ ሀ ከ /1ሀ/፲መ፳ዉ60 0000000 mineg 
[000000000000 








start kernel [] [] POON init/nain c */ 
1 


setup archi] 0 ; 
} 


በገ U D U D 0 0 00 0 000 0 DU U D U 0 U D U 0 0 0 00 0 U U 0 0 U D U 
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[| | Linux | Ul 


uuu 386] 48000 ה‎ D D D D D 0 D D D D D D D በ በ በ በ Pentium DOO 48 
U D D DDD 386000000000 RAAT DD 00 በበ |] D በበበ RMD 0000 በ 
U D D setup arch] ]O D D D D ine D 0 0 D D D 0 D D D D םםםםהםנסע‎ 
paging 1110 ף 00000 0*/ ;ה‎ arcWi386/nminit.c */ 
0000000000000 ገበ በ በበበ]በበበ ገበ በበ በበበበበበ[በበ[ሀ 
በበበገበበበበ በበ በበበ በሀበ በበ[ በ [በበበ pegng init[] D D 00 በ 


םםםםםםםהםםםהםםםםם 
trap init 0  /ሚ] 000 arch/i386/kernel/traps.cQ [ [] */‏ 


U U 0 U D U 0 00000000 DU 0 U DU D U 0 U D U ሀ 0 1 set trap gate 
U U set systemgate [] U 0 D U D D D U D 0 0 0 D U 0 0 0 0 0 0 0 D U 0 8 
U D D DD nme D 00000000 trapin [00000 םםםםםםםהםהשא‎ 
U D D DDD DU veep D DDD 0.0 D D D D Ems JQOO000B8GQ0000000000 
U D D 0 0 0 H ms 0 0 0 0 0 D 0 0 D DU 00 0 0 D D D 00 D 0 0 0 0 D H me 0 0 0 Ú 
O000000000000000000000000 8GQOOOO0000000 
U uuu 
OOOO trap 1nmtD 0000000000000000 መበ 00000 Gt 
םםםםםםםםםםםםםם‎ init task D D 0 0 0 DDD D D 0 init task[] TSS 


በ UTD D 1111 1 0 1 s0 כ‎ 
int ה‎ /* [] arch/i 386/ kernel /irq. c [] D ה‎ */ 
OOO000000000000000000000000000000000000 








































































































U U 
OOOO intel [ 886000000 הפש‎ D D D D D 0 000 DD D D 0 0 
םםםםםם‎ 16000000 bO0000000000000000000000 
םםםהםהאפםםםםםםםםםםם ; םםםםםםםםםםםםםםםםםםהם‎ 
O00000000000000"00000000000000000000000 
םםםםםםםםםהם‎ ir hD [በበ 


struct irqaction + 
void [] *handl er[] D int] void * struct pt regs ኘ[] ; 
unsi gned | ong 11 ags; 
unsi gned 1 ong nask; 
const char *nane; 
voi d *dev id; 
struct irqaction *next; + 
U D DD 0 0 D 0 000000000000 
static void nath error irq] int cpl] void “dev id] struct pt regs *regs[] 
t 























0 
U 
[] 
[] 


EIERE ER 




















out b] O] OXF] ; 

if [] ignore 12013 || ! hard nath] 
return; 

nath error] [] ; 


static struct irqaction 12013 = 1 math error ird] O] O] "rath error"] NII] NIL}; 
U DDD በበ በ በ በበበበ ገ በበበ ገበበሽበበበበበበበበ[;[በ int ir] 00 
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Ol Linux [ 


OO000000000000000000000000000000000020000 
0000000000000000000 829000 םםםםםםםםםםםםםנסע‎ 
בםםםםםםםם‎ @20N DDD DDD 00 8000036000000000000 
DOO0000000000000000000000000000000000000 
OOO00000000000000000000000000 setup x96 irqad D D DU D 


000000 O 3860000000000000000000000000000 
sched init] [] /*[] / kernel / sched. c [] [] [] */ 


O0O00000000000000000000000000000000000 
O0O00000000000000000000000000000000000000 
םםםםםםםםםםםםםםםםהםםםםםםםםםםם‎ int h n nn 


kernel/softirq.c[][] D tiner[] tqueud] i nmedi ate] | 0 1 | 1 D D D B. 0 0 0 በ በ [ 
tine init[] [| /*[] arch/i386/kernel/tine.cQ QQ */ 


በገ U D U D 0 0 00 000000 0 U D U 
U U U U U U D 00 0 0000000 00 0 U D U 
U U U በበበ በበበ 0000000 00 0 U D U 
U U U በ በ U D 00 0 0000000 00 0 U D U 
U U U [በ በ U D 0 0 0 D U 00 U 
U U U U D U D 0 0 0 D 0 00000 0 DD በበ 0 U D U 0 0 0 00 0 U [ ሀቨ 
םםםםםםהמב‎ 20000000000000000000000000000 
O000000000000000000000000000 םםםםםםםה‎ 

0 

[] 






















































































linux] UNXIJ D D 0 0 0 0 U 
በገ U 0 U D 00 0000 U 
በገ በ 0 U D 00 0000 U 


[] 
[] 
[] 
U U 0 U D 000000000 U 


0 
0 
[] 
[] 


EI Ts en E=] 






















































































U DD DDD DDD 00 DD D D D D D D get cros tin] D LO 00 HnxOOO 
U D D D Qp D D D በበበ] DDD DD D DDD D D DD DD 0 QO OD 10 
םםםםםםםםםהםםםםםםםםםםהםםםםםםםםההההאתעתםםם‎ 0 
םםםםםםהםםםםםםםםםםםםם‎ መመበበበበበበበ > 000000 
U U U U D 0 0 DD 0 U DU 0 UD U 0 U D 0 0 U UD 0 U D U U 

parse options] | /ኻ] nain.cQ ה‎ D V 
በገ] [በ በ በበ ጠበበ ገ D D debug] םםםםםםםםםםםםםםהההה:שנו‎ 


U U U U በበ] በበበ በበበበበበበ በበበ በ[በበ[ 
console int] | /ሚ] linux/drivers/char/tty io.c[] [] D */ 


በገ]በ]|[ በ በበ በበበበበበበበበበበበበቨበበበበበበበበሀሸበ TYO D D 
DOO000000000000000000000000000000000 TYO ODD 
000000000 
10811 0ር init /*[] linux/ nmíknalloc.c[][] 
10811 0ር [] [] [] [] kernel nalloc [] [| D] Ú] 
knalloc 1 DD DDD 00 0 DDD D 0 00 0 D D D D 0 0 0 D D 0 kealloc [UU U 
በበበ 000 0000 0000 0000 0 U 
םםםםםםםםםהםםםםם‎ 
00000000000 חםםםםםהםםםהםםםההםהםםהםהםהםהאע‎ 
Domm [000000000000000000000000000000000000 
U U U በበበ ገ] በበበ በ በበበበበበበገበበበበ[በበ[በበበ; 





LJ בש ב‎ Ee" E) 
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[ Linux [ Ol 


ህኣመበ 000 eta‏ בםםםםםםםםםםםםםםםםםםםםםםםםםםםהם 
םםםםםםםםםםםםםםםםםםםםםםםםםםםםםםםהםהםםםה fat‏ 
D 0 0 0 0 D 0 00 DUU‏ 0 אאתהםםםםםםםםםםםםםםםםםםםםםםםם 
VS) D 0 00 0 D ON ON NON DD 0 prof DO DO‏ 
U U 00000 UU 00000000 D 000 0 0 D D 0 Box 000000 000 U‏ 

[] 

[] 



































U DD DD DD DDD DDD DD D D D DDD D በበበ Wndow[] FAN IJ J U 0 Ú 
በበበ האש‎ መመክመበበበበበበበበበበበበበበበበበበ DD DDD DDD D 0 0 
DU D D D VWSD 00000000000 rare הח‎ D D D በ D ind D] 0 C] D D. D D [ 
U D DD 0 0 D DD 00 DD DD D D 0 0 U 

inode int] | /*[] li nux/fs/inode. c[] [ [] */ 

000000 ጃ%በበበበበበበበቨበበበበበበበበበቨበበበበበበበ[በ[በበበበ 
מםםםםםםםםםםםםםםםםםםהםהםםםםםםםםםםםםם‎ 

nane cache init] 0 /*[] linux/fs/dcache. c [] [] [] * 

0000000 VS00000000000000000 UL D DDD D D በ IRD 
ee linux/fs/buffer.c[] ה‎ */ 


000000000000000 buffer free list [] (] OD 
neminit[][] /* 0 arclyi386/ גת‎ ፲11.. ር [] [| [| * 


በበበበበበበበበበበበበበበበ/%ቋርበበቨበበበበበበበበበበበበበበበ[[በበ 














































































































OO0OO0O000000000000000000000000000000000 
“ Login] ” DD DD DD DDD DD 0 0 0 0 D D D D D D D desg| ההש‎ I 0 D 00 




































































[] Loadi ng ...... 000 booctsect. S | 0 D B D D U በ] U U 

U unconpress ...... O0O0000000000000000000000000000 
U U U U U 

U 0 D 0 D 0 nain cf start kernel | 0 D D D U U U U 0 

[] Linux version 2. 2. 6 [] root (dancef] [] gcc version 2. 7.2. 3 [] lg ה ה‎ 000 
U U U D D D 0 UD 0 U መር0 0 10 
[] Detected 199908264 H processor] [| init tieg 00000000 
[] Consol e: col our VA+ 80x25[] 1 virtaul consol ef] nax 63] [| | | console init] [] 
םםםםםםםםםםםםםםםםםם‎ WO00000000 60000 
O Mnory: 63396k/ 65536k avai I abl ef] 848k kernel code[] 408k reserved] 856k dat al] [] 
OO int ₪ 000000000000 65536] D 000000 6339688] OOOO 
U D D 0 D 0 ה‎ D D D D በ በ በ በ ה‎ በ በ 85680 D 0 D [| [ 
[] VES: D skquotas versi on dquot 6. 4. 0 initialized] [| | dquote init[] הה‎ [] [| Ú 
U U quota] NOD D 1111 1111111010 0 0 D 0 0 0 D 0 0 U 
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Ol Linux [ 























םםםםםםםםםםם 
Pd: A HO revision 2. 10 entry at Oxfd8d1 |‏ ][ 
Pd: Using configuration type 1 |‏ 


Pd: Probing PA hardware [| | D pci 18 (1111110111 0 1 
O Linux NT4. 0 for Linux 2 

Based upon Swansea Ui versity Conputer Soci ety NEI3. 039 

NEM: UN X domin sockets 1.0 for Linux NA. 0. 

NETA: Linux TCP/IP 1.0 for NM. 0 


IPProtocols: ICM] UH] TOY [| | socket init הה הה‎ 00000000 Linux 
040000000000 sockets 1.09 1.0000 ה הז‎ D TOPIPE ( U U U ü 
TOW] UH] TPO [1 1 LU 

[] Detected PS/2 Muse Port] 

Sound initialization started 

Sound initialization conpl ete 

Hoppy drive] s[] : 100 is 1.44M 

Floppy drive] s] : 100 is 1. 44M 

HC 0 is a National Semiconductor PC87306 0 00 device setup] | הה‎ | 00 
በገበበበበበ p/200000000000000 

በበበበበገ በ በበበበበገበበበበበበበበበበበበበገበበበገበበበ[በበ[በ[0 
U U U U 0 በበበ በበ በ በበበበበበበገበበበበበበበበበበበበበበበበ;በበበ[በ 
DOO000000000000000000000000 int DD 00 DDD 000 0 
OQ start kernel[] ה‎ (] D 0 H1 0 0 D 0 0 


13.6 ה‎ int [| 


በበበ በ በበበበበበበቨዘበበበከቁጩመበ[በበበበበበበበበ[በ9000ቨ 00 D ms 
U U U UU U 000 U 


13.6.1 int J IO 00 


Enx[J0000000000 int D 0 UU 00000000 kernel thread init] 
םם--םםםםםםם:שוםםםםםםםםםםהם התא‎ Ea ND 100000 
O0O0000000000000000000000000 

000 kernel thread] init] התא‎ GO D 0 00000 ₪262 - 
Ant 00000 int] 0000 int] 000000000000 is GO 00 U 
000000000 

s OO dbflush] ksvapd[] 00000000 

e O00 tty1 D D 00 0 0 D 0 0 0 0 0 0 በ comcd e) DD 0 D D 0 D 0 0 0 0 0 U 
U D U U 0 U 

s OO into HH nus 0 0 0“ /%ሀሃ/1፲!”በ םה‎ H H ה ה‎ መጪ0 ה‎ P /bwint” 
በበበበበ በ ገ በ በበበ” שועשפ‎ DD DD DDD DDD DDD D 0 DDD 000 
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[| [ Linux | ul 


OOO 1111110000 בםםזשו‎ 

በ etc/init] 00000000000000 ist QOO0000000000000 
םםםםםםםםםםםםםםםםםםם‎ 

0100000000 

02 0000000000 

0300000000000“ getty” 000 
0400“ etei re" הםםהההה‎ 

U D 07 getty’ ה"אויםםםםםםםהם‎ D D Dp [በበ በ 0 D 0 OOO" getty” 
OOO" exec’ U" login] OO" login” D 0 D 0 D 0 0 D 0 0000000 D" login’ 
OO” exec" OO shell DD D D 0 0 0 0 D 0 D 0 D DD DD XWndowe [000000 
U D NO shell 0 00 DDD DD DD 0 0 0 0 D 0 D 0 0 DD D D D 0 D 0 hoep ood 
profileQ DD Ú 

init 1111110010 010 1000 በ በበበ ገገ ገበበበበበበበበበበ1መ1 D 
םםםםםםםםםםםםםםם‎ “ getty” OO0O000000000000000 
*םםםםםםםםםםםםם‎ getty” OOO" exec” "םהה‎ fok’ JO Ü Ú 
“login” OOOO“ login” "םםםםםםםהה‎ getty’ 00000000000 
OOO“ login” 0 DDD 0 0 00 shell 0 0 0 DDD DDD 0 0 0 0 D 0000 0 
0000" getty’ በ 
በበ] D 1nt JOOOOO000000"00”O0O0000000000000000 
בםםםםםםםיםםיםםםה:שוםםםםםםםםםםםםםםםםםםםםםהם‎ 
በበበበበበ invit O00000000000000000000 

init JOOOOOOOOOO Ex 0000000 sysvint[][] Miquel van 
Snoorenburg] D 00000000000000 הפפ‎ በ ገ በ WNx0 BO] D U [| 
በበ initOO0000000000000000000000000000000000 
SystemV D 000000 םםםםםםםםםהםםםםםםםהםההההפא‎ 

U 5.120000000000 



































ፒገ EJ r3 r3‏ בם 
Oo Ed ₪ EJ‏ 
DIO‏ 

















o 
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BOOT 




















Linux [ 















































INIT 


GETTY GETTY letc/rc 
letc/local.rc 



































exec 
LOGIN 


exec 


SHELL 



























































በ 1312 1100 




















fork 





U 















































13.62 O00000 המחה‎ 

























































































/etc/inittab 










































































Shell Script 

















letc/passwd 









































letc/profile 





Shell Script 

















$HOME/ profile 

















$HOME/.login 


U U 0 0 U 

















U DD DD 00 DDD D DD Sell 0 0 0 0 0 ——Shell קאמ‎ [J 
“ $HM profile” [| “ /etc/inittab” DD D D D 0 D 0 D 0 D 0 0 0 D 000000 D 

DODO000000000000000000000 ሞወመበቨበበሀበበበበበበ[;ቨ 
[/etc/'inittab] D D 10” Login” DD 00000000000000000000 
OOO000000000000000000000000000000000000"$ 
OOO000000000000000000 Shell D bash] ksH] OO םח‎ D D 0 Ú 
OOO0000000000000000000—00000000000 

OO00000000000000000000000/&cOOOOO םםםםם‎ 
OOOO0000000000/&tcOOOOOOOOOOOOOOred 00000000 
0000000000000 /etc/inittab[] ה‎ IJ0000000000000 init 
በገ U U U D 0 0 0 D U 00 U 

D /etc/inittab]init D D D 0 0 0 D 0 D D 0 0 D D DDD DDD 0 D 0‏ םםםםם 
U U U U U U D 0 0 0 በበበ በሀበ በበበ በበበ በበ U D U DU 0 U D 0 0 0 U‏ 
U U U U U U D 0 0 0 D U 0 0 0000000 DU 0 በበ U D U DU 0 U D 00 0 U‏ 
U U U U U U D 0 0 0 0 000000 00 0 U DU D U 0 UD 000 U‏ 

U‏ 700000 םםםםםם 

o םםםםםםהםהפטאוםםםםםםםםםםםםםםםםםםםםםםםם‎ 
U U U U 
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000000000000000000000000000000000000 1 
מםםםםםםםםםםם 

2 0000000 3000000000000000000000 NSIOOOD 
U U U U 

םםםםםםההאתע םםםםםםהאעם 000000000000 3 

4 0000000 

5 0000000 X ዛጩጩበ 

6 00000000000000000000000000 intteb D D D 0 [ 
U U U UU 00000 

በበበ 700000000000000000000000000000000" init 
X 0X0 02.....60000000000000000000000000000000 
םםםםםםםםםםםםםםםם‎ A 

U D D DD 0 inttb] 00000 










































































id: 3:initdefault: 00000003 

#Systemi ni ti al i zation. 

si::sysinit:/etc/rc.d/rc.sysinit D D 0 DD 0 D D חי‎ D D DR 
/ etc/ rc. d/ rd. sysi nit[] 

10: 0: vai t: / etc/ rc. d/ rc. 0 0 0 DDD 0 በ rc. 0] 

11: 1: vai t: / etc/ rc. d/ rc. 1 ההההההה ה‎ [| rc. 10 

12: 2: vai t: / etc/ rc. d/ rc. 2 0 200000000 re 

13: 3: wai t: / etc/ rc. d/ rc. 3 0 300000000 rc. 37 

14: 4: vait:/etc/rc. d/rc. 4 0 400000000 ፲ር] 

15: 5: wai t: d/rc. 5 D500000000 re. 8] 

16: 6: vai t: / etc/ rc. d/ rc. 6 OD 600000000 rc 6] 

#lhings to run in every runl evel [] [] | 111111 0 1 0 ሀ 

ud: : once: / sbi n/ update 

#Am gettys in standard runl evel s 0000000000 


1: 12345: respqun: / sbi n/ mngetty ttyl tt 1000 10 29 4 ብ] 50 0000 
2: 2345: respqun: / sbi n/ ningetty 2 tty20 00 21 3 40500000 
3: 2345: respqun: / sbi n/ ningetty tty3 tty30 OO 234 500000 
4: 2345: respqun: / sbi n/mngetty tty4 tty40 00 21 31 40500000 
5: 2345: respqun: / sbi n/ ningetty 1175 tty50 00 234 500000 
6: 2345: respqun: / sbi n/ mngetty tty6 ttys) 00 234 500000 




















#Am xdmin runlevel 5 000 500 X Wndow] 

x: 5: respawn: / usr/ bi n/ X11/ xdm- nodaenon 

00000000 imnittab[ odd 

በበበበበ በበበ DDD 1nttab 00000 400000 4000000000 
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id: runl evel d: acti on: process 


U U U U D U D 0 000 U 


id 0 D 0000 U 


runl evel s[] [] 


םםםםםםםםם 
action] [] 0 []‏ 
U U U U 0000 U‏ 


* initdefaul 
U U U U D 00 U 














U 
/ etc/ rc. d rc. JQ 
U 


e Sysinit[] 





U U U U 0 U D U 


U U U U U 








OO getty] 


010000000 
በገ] U D U D 0 0 0 0 U D U 0 0 0 0 D 0 0 0 0 0 0 U 0 U D qatdl D 0 D UU 


QO action[] [] boot 


U U 

















e ሂብ U DU00000000 00000000 0 DU 00 D 00 0 D 0 D 00 U 


° את‎ [| | ገ በ process 1 D U 0 0 0 U D 0 0 0 0 0 0 0 0 D 0 uu 


D D D D D 0 0 000 D U‏ 0 השאחפוםםםםםםםהםם 
runlevel ከ‏ 4000000000 םה הסט 3000 በ1100‏ 
U 0] 1] 2.....0s00 SI‏ 
DintJOO0O00000000000000000000000‏ 


OOO0000000000000000001000000000 
0 rulevel ה‎ 30000000000 300 00000 
X Wndow] 
OOO00000000000000000 imttabQOoodd0 
boot wai LD 000000000 action[] sysinit 0 00000 























U D D 1nmtLtabD D D D D 0 0 00 DDD D 0000 U 
U DD [ በ በ /ete/rdc/re.sysintQ D D D D D 0 D 0 D DD DDD D 0000 U 


U U U U U U D U D U pred] HH D U D D UL D D L 


020000000 
በበበበበበበበ በበበ PANDO 00 000 0 00 0 DD 0 0 000 000 0 U 











וםםםםםם 
































000 re.sysint JOD המו‎ QinttQ (D DI inittabl] D D 000000 
DO /ete/rc.d 000000 rc00000000000 0000 ፤6ቨ[ 0 OD reg 
U U U በ U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U DU 0 U D 0 0 0 U 
םםםםםםםםםםםםםםהםםםםהם‎ re 3000000 cronjsendmal בה‎ 


nit [ [| 0 [| 


በገ] በበበ በበበ 0 U 0 0000 000 U D 0 0 በበ U 0 0 D 000 000 U 
inxlOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOO 
U U U UD U U D 0 0 0 D U 0 0 0000000 00 0 U D U 0 U D U D U 0 U D 0 0 0 U 
U UmxQ 0000 0000000000000000 0 D 























gettyD D D D D 0 0 0 0 0 D D Gni U 


o 
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00000 Eng םםםםםםםםםםםםםםםםםםםםםםםהה‎ 


םםםםםםםםםת 





























































































































: U D U DO DUDU U U uu 
nodul e ini |Q O00 | mdde init [00000 םםםםםםםםםםםםהבםםן‎ 
L OOOO j(» םםםםםם‎ 000000000000000 
D DO uu nodule init 000000000 
U በ“ intcal.in" 00000 
| DOD init 8019000000 
i םםםםםםםםםםהםםםהםהם‎ 
uu 
: nodule exi |] D ף‎ | nodule exit XD D D DDD |000000000000 rmod 
በ ft OOOO j(» םםםםםם‎ OOOOOOO måde exit[] 0 
በ በ 000 DO cleanup rodde] O D) በ 
በ clea pp 1101100000 0 0 
000000000 rode ext 
O000000000 
በ | atonic rea [1 000 | atonic read ההחהצ‎ atom |00000 Y HU H 
pud uu ( v) ict D000 | atone 000000 240 
0 U 
U atomc set | םה ה‎ | atomcset(v, |v ה ה‎ 0 |OO00 הההההצ‎ 10 0 
0 00 i) atomc L H [| DD atom ቨ[ ሀ ה‎ nnn 240 
U 0000i00 
U 0000 
atomic add | םה‎ በ በ | voad at omc add i 00000 (00004000 v 00000 
OOOO | (int i, /OOvVOOO םםהםהםההששפאן|‎ 240 
00 atomc L * v) atomc t QQ 
000 
atomic sub [] 000 | voidatomc sbji ה הה‎ 00 NONG vol i000000 
U D U (int i, Ov DDD | aomeQOO0000 24400 
atonic t * v) atomic + [] [] 
uuu 
atonic sub |] በ ם‎ | int atomc sub (i O0 000 0000 ሃበበ1[000000 
and test |0000 | andtest (im צהה‎ 0000 O0000000000000 
OOOO li, atomc [*ህ | atomct OD 000000000 atomc[] D 
U U D U OOOO 240 
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atomic inc | הה‎ [] ] | voad at omc 1 lv 0 ה‎ 0 0000 vol 1000000 
0000 (atonic t * v) | atomc tOO | הפסא‎ [] [ [] D] [] 240 
OOO 
OO 
: OOO U U OOOO OO U U 
0 | atomc dec {OOOO | voidatomc dec | v ה ה ה‎ || 10[[ vol 100000 atomic 
Ü 0000 (atomct * v) | ao mct 0000000 AO 
U U 0 0 0 0 
U 
በ | atomc_dec | በ O00 | intatomc dec |v D በ በ םםםהם|‎ በበ 1000000 OO 
በ | andtest | U and test ato mct |QOO0000000000000 
በ (atomc t*v | O00000 OOOO atonicOOOOOOO 24 
U 
atomc inc |] 1] D | int atomc inc v በ በ 0 10000 vod 00000 OO 
_and test |D _and test ato mct |QOO0000000000000 
(atomc t *v חםםםה|‎ OOOO atonicOOOOOOO 24 
U 
atomc add D D OG | int atomic add |i הםםהםם| בה הה‎ vou 1100000000 
negative | [1 D በ | negative (int | םםצםהה‎ |0000000000000 OOO 
0000 li, atomc t*v) | [ atomct |00000000 atomcQ D D Ú 
U U 0 0 0 0 OO 240 
et unalign | D O00 | get_umaligned | ptr OOO |0000000000000000 
60 OOOO | ptr) 000 በ በበ] በ110 በበ በበበ በበበ[ 
U םםםםםםםם‎ 16000000 
000 vp 0000000000 
U D በበ] በበበ በበበ በበበ በበበ 
U 
put walig {OOOO | put waiged | va OOO |0000000000000000 
ned OOOO | ( val, ptr) DOO00mRr O000000000000000 
000 00000 םםםםםהאש,‎ 46000000 
000 00000 
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ል፻፤ 






















































































O Lr 
Oo 
O Lr 
Oo 








nenber) 








[] | schedule t si gned long | tineout D (0000000000000000 
U | ineout sche- ם‎ jiffies 0000000000000000 
U dule ti neout 00000  በበበበበገበበበበበበበበ[በ[[ 
U (si gned ] ong 000 በበበ] በበበበ በበበ 000 0 
D ti neout ) U U U 
U 
በ ם‎ TASK UN אא‎ PDH חח‎ D ሀ ከ 
በ סםםםםםם‎ 
: [| TASKINIERRPII HH] D U D 
[] O0000000000000000 
בםםםםםםםםהםםםם‎ 
D00000000000000 
[| H TASK RUN NG] 
20 D DD 00000 0 
000 uu OOOO OO OO 
list add void list add (struct | nw] 0000000 Dead | [] በ ה ה‎ Ú 
list head * new struct | DD D D D 0 D 0 D 00000 
list head * head) 000000 
uut 
U 
list add tail voi d list add tail | nw] [] [| [| [] | [| head | 00000 
(str- uct list head * | 000000000 uut 
new struct list head * 00000 
head); U DU D 0 0 
000 
list del 00 void list del (struct | entry 1111111[0[] [በ] 
00 list head “ entry): 00 
OD 
list በ] init | 0 0 void list del init | entry በ 1110100000 
00 (struct list head *| 00 
O 00 entry) 
U D 
U 
list_enpty 00 int list empty (struct | had] ה הה‎ Ll [] [] 
Od list_head * head) 
uu 
list splice 00 void list splice | list [| [] DO [| 0 0 L] head 
00 (struct list had *| 000000 
00 list, struct list head * 
head) 
list entry list entry ( ptr, type, | pr | OQ list head] [] 


U U type l U 0 0 U D DO 
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U U 


renter D D D type D 00 
0000000 list head 





list for each OOOO list for each ( pos, 
head) 


pos JO list head |] [] 
OO 
OO 


0000000 bead] 
[] 








3000 enun 


CD 0 D D U 0 0 Hm 0 0 DD 000 0 U‏ םםםםםםםםםםטםםםםםםםם 


U U U U U U D 00 0 0000000 00 0 U D U 


口 
C) 


a 000 000ከ 


U D U 





sinple strto 
1 


long simple strtol 
(com st char * cp, 
char ek endp, 
unsi gned int base) 


Ooo 
Ooo 
Ooo 





sinple strto 
11 


1000 1000 
sinple ₪6 1 

(const char * ጩጨ 
char ጋ endp, 
unsi gned int base) 








L3 בם‎ c c c 
L3 בם בם‎ 
O OG 0 











בם בם בם בם | בם בם בם L3‏ 
C C‏ בם בם | בם בם בם L3‏ 


Oooo 





000 U U U U U U 


U U 
U U D U 





sinple strto 
ul 


long long 
singe strtoul 

(const char * cp, 
char 六 水 endp, 
unsi gned int base) 


L3 בם בם בם‎ 
Oooo 
Ooo 
Ooo 
Ooo 





C) C‏ בם בם בם בם בם 





sinple strto 
ull 


long long sine 
strt- oull (const 
char * ጨ ር KK 
endp, unsigned int 
base) 


O crc 
O בם בם‎ 








Oooo 
Oooo 
L3 בם בם בם‎ 





vsnpri ntf int vsnpri ntf (char * 
buf, sizet size, 
const char * fnt, 


va list args) 





Ooo 
Ooo 
Ooo 








EE ET E 
Oooo 
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nooo ooo 
=== ooo 
oanad Moi 
ב כ בם בת‎ ooo 
boos ጋመመ 
QoS Ñ ooo 
ש‎ 200 == 
o 
ב‎ SEER 
T C) ₪ 44 rr noo 
& noo ጄ “o0 
< 口 口 口 口 3000 
* + + Kk + * 
š hy 3 
: ER 8 5 |38 
ርጋ 
ዳ 355 oO - ርጋ eo 8 
Sou + Eo ga. 
4 Bar 2 o 8 שי‎ i 
mn 一 AGO 2 © © 
B 8 ₪ 8 n © o 7 N 
Ere * eye 
T ; siz sds 
ጃ ERE ጃ $5 E 
Pas = ርጋ ש‎ Ox o 
o ooo oo ooo 
ooo oo ጋጀ 
口 口 口 BA Tail oo 
nooo E == = 
nooo ርጋ CSC 
KI) 
B : 5 
par a 
B Ñ 只 E 
o - + 
> n n n 











dest 0 000000 
src] D U D 


u, 
DU 





H au 
char * strcat (char * 


, const char * 
char * strncat (char | dest 
* dest, const char * A 


char * strchr (00051 


char * s, int c) 








[] 

















0 


0 








strncat 
strchr 
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strrchr 00000 | char “strrchr (const סההההההההה>|‎ 
00000 | char * s, int c) 000000 
U att 
00000 
strlen 00000 | 8126 1. strlen (const | 511111 1 [1 tL 
00000 | char * s) 
strnl en 00000 | 81261 strnlen | si D U d 0 0 ሀ 
00000 (const char * s, 
00 size t count) 
strpbrk 00000 | char*strpbrk(const | D D 0 D 0 D 0 0 0 
00000 | char*cs, const char | ה‎ 0 D 0 D 0 D 0 0 
00000 | * ct) 
0000 
strtok 00000 char “ strtok (char * s) D 0 D 0 D 0 D ct 0000000 
00000 s, const char * ct) מםםםםםם מההםםהה|‎ 
ה‎ U D በ strsep 
nenset 00000 | void“ nemet (vid*|/s 000000000 | 77000000 
00000 s im c ₪ הםהםהםהה>ההה|%‎ OOOO mm 
count ) O הפס‎ D D [| D | | sett D 0000 
O nenset io 
bcopy 00000 | char * bcopy (const | ssc םה הה‎ D D dest D D 0 D 0 UD 
00000 | char * src, chr * | 00000000 cout (OOOO ne 
00000 | dest, int count) U D DD 00 0 ncpy 70000 
ה‎ 0 #0000 
000 von 
DH DT: D TT T 
nentpy toio [| 
nentpy from o 
U U 
å ם‎ D D ם‎ 0 uU au | H ם‎ 0 
U | nenepy 00000 | void? nengpy (void | dest DD 0 0 DDD | በ מםםםםםהסע‎ 
[] 00000 | * dest, const vid src 0000000 | | ፲ 6ጩ 1ዐ0 | ne- 
[] 00000 Ir src 826 1 | comtg [1 [ ה‎ [ሀ H | mw fromo 
ה‎ [] count ) 
U nenmove |[[ [ [ | void + nennove det ה‎ DDD | nencpy[] nenmove [] [] 
00000 | (void*dest, const | src NANONOOD |0000000000 
00000 | vwoid* src, 26 1 | comt 0000000 (OOO 
Ü count.) 
nentnp 00000 | int nenenp (cost | [000000 ct 
U au void * cs, const ||](] D 0 D 000 ü 
voi በ count [00000 
* ct, size t count) 
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A Linux API 
nenscan 00000 | void * nenscan adr J D D 00600 (NO םםםםםםם>‎ 
U D [ [ | (void * addr, int | D 000000 size! 00000000 סש‎ 
000 C, 000000 0000000000 
size t size) U 
strstr OO התא‎ | cha * strstr | 61 ה ה הה‎ D 2 
00000 | (const char * sl, 19 00000 
00000 | const char * s2) 
0000 
nenchr U D 00 | void * שת‎ sOOOOOOOOO |00 cd 100000 
00000 | (const void * s |QO00n00000 (00000000 סש‎ 
000 int c, sizet n) O H H 
set_bit OOOO | void set bit (int הש‎ 00000 edd | 00000000000 
00000 | w, volatilevoid* |00000000 O0000000000 
00 addr) [| set השההה+א‎ 
בםםםםםהםםםםהם‎ 
uu 
set hit |] םהה‎ | void . set hit | nr] [ [ 00 0 (addr 
U D 0 D (int nr, valatile 00000000 
void * addr) 
clear bit |G 0000 | void dear bit | DD DD DU add 0000000000 
በ U Du (int nr, volatile 00000000 0000000000 
በ void * addr) 0000000000 
በ U ה‎ 5፲8 nb before. 
clear hit [ snp nb | 
after clear bit [] [] [] 
0000000000 
000000000 
. change 1 D 0000 | void change bit nr U (] [] 00 ם‎ add | Q change bit [] O00 
bit U au (int nr, vaatile QOOOOOOO בםםםםםםםם‎ 
voi 6 * addr) 
change bi | D O00 | void change bit | nr[] 00000 [ፎዐር 
t U au (int nr, voaatile/ 00000000 
void * addr) 
U U 
å ם ם‎ D | 0 0000 ם 0 ם‎ 0 
በ test and |O 0 0 D | int ₪ םםםםהםהה‎ በበበ በ000 
በ set bit 00000 | test and set bit addr 11[1[[ D D 
በ H H (int nr, volatile | [] 











void * addr) 
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OOOOG in test andset ኛ]1110[000 (0000000000 
tet an |00000 | bit (int n, | addr JO 00000 0000000000 
d set bit OOOO volatile void *| 0 H H H H H H 
addr) U U 0000000 U 
U U 0000000 U 
U D D 0000 0 
test and D D 0 0 0 | int n בסםםםםםםםן םםהםהםה‎ 
clear bit | 0000 | test and clear bi | add ההההההה‎ 
00 + (int nr, volatile | [] 
void * addr); 
tet an lD 0000 | int n DD DD םםה‎ በበበ በ[በበ[በበበቨበ 
dcler חהההה|פ‎ test and clear addr DOOOOOOG 
it OD bt (i nt n, | [1 D 
volatile void * 
addr) ; 
test and |OO000 | int n םםהםהםה‎ በበበ[በ[በ[[ቨ 
change bi D D D 0 0. | test and change | addr 0000000 
L DUT bit (int nr, | J 
volatile void * 
addr) 
test bit 00000 | int test bit (it |r J 000000 
uuu nr, const volatile | 0 O0 adr [] B DJ חח‎ 
void * addr) 000 
find 1185110000 | int adr D D D D DDD (0000000 000 
t zero bi |G 0000 | find first zero ההה‎ size הההה‎ Ü 
L OO 000 | bit (void * add, | DD OU U 
unsi 0060 si ze) 
find net | םה םהה‎ | int addr D D HOLD D ሀ 
zero bit | ה‎ [ [ | find nex zero U [] [] 8126 [] 000 
OM 000 | bit (void * add, | הה‎ Ü ה‎ ከ D offset 
int size, im םםםםםםםהה|‎ 
offset) 
ffz 00000 | unsigned long ffz | vord(] [1 [] [1 [] Ú 
N00 0 (ህቡ signed long 
word); 
ffs 00000 | int ffs (int x) 200000 U U 0000000 U 
00000 ibe]000 
hvei ₪32 OOOO N| hvei ght32 ( x) 200000 U U 0000000 U 
00000 00000000 
000 
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U 0 0 U D U D 0 0 U U U D 
knemcach | 00000 | knemcache t * | ם | אא‎ /pro/ 10 0 D 0 D DD 0 DD 0 D 
e create | D D knemcache create | sl abinf0] 0000 ההםההםההההההה|‎ 

(cost char םםםםםםםםםהםםהה| פאםםםםםםה|*‎ 
name, size t size, | ההההההההה‎ |000000000000 
5126 1 offset, ה ה ה ה םה ה|‎ |B000000000000 
unsi gned long | offset 0000 OOOO ctor000000 
flags, void | በ n flags) 91800 00000 dor0 p 
(*ctor) (vo, በ ctor 
knemcache t +, 
unsigned long), 0 שא‎ DDD DD 
void (*dtor) םםםםםםםם‎ 
(voi de, 
knem cache t +, 
unsi 0060 | ong) ) ; 
knemeach | D D 00 |int  knemcache | Cachep 10100 10 0 0 D D 0 D D 0 0 0 
6 shrink | [1 l shri nk OD slag] I[000000000 
(knemcache t + og 0 0 00000 slab 
cachep) 
knemeach | 0000 | in  knemcache | cache] 00000 0 81851 [1 [0 DD kem 
e destroy | OO dest roy uu cache + [00000000 
ን ከ E # 00000000000 
cachep) ; 000000000000 
knem cache destroy [] [] [] 
በበበበበበበበበሸበበበ 
U D 0 0 U 
knemcach | 00000 | voi d * knemcache | cacep[ 00000 |0000000000000 
e alloc U alloc በ0[07፡19ሞ8ሞ000 |000000000000 
(knemcache t * | knalloc() 00000000 flags 
cachep, int 
flags); 
knal I oc U D 0 0 void * kmalloc | size] DDD D 10 םםםםםםההה>6ושא|‎ 
(size_t size, int | םם הבה‎ flags 00 (00000000 flags 00 
flags) 0000000 000000 
GP ŒR- (000000 
000000 
GP KANL- [00000 
0000000 
GPAIMC- 00000 
OO000000000000 
00000 GP DA [ በ 
U 0 DDD DDD 0 D 0 
DA D D ገ 1386[ | D 0 [] 
םםםםםםם‎ 168000 
U 
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UU Linux | Ol 
knemcach | JO 000 | void knemcache | ₪8 O00000 |000000000000 
6 free 0 free U 0 0 980000 |00000 
(knem cache t 000 
Coachen void + 
obj p) 
kfree 00000 | void kfree (const | obj p[] [| knall of] [] 
OOOO void * objp) U 0 0 0 0 
5] Linux | [| Vë 
: OOO OO 0000 U U U U 
U 6184168 D D ה‎ O jin dinvalidate | dentryQ 00 |0000000000000 
U te OOOO (str- uct dentry | 00000 םםםםםםםOOOOOO‎ 
በ * dentry) 1[1[ በ; በ በ ፤።ቿ በ -፻88ቭ D 
በ U D 0000000000 O 
[] d find ai | ] [I [| D | struct dentry* |inodeeQ ההה‎ | በ ה‎ inode [000000 
65 U D ם‎ | dfind alias 00000 OO000000000000 
OOOO | (struct inode + OO000000000000 
U O inode 000000000 
U DU DDD DDD 0000 0 
םםםםםםםםם‎ 
prune dcac | 0 D Ú O | void cont OOO 1 0 D 0 D 0 D D D 0 D 0 0 0 
ከ6 OOO prune dcache 000000 םםםםהםםםםהםםהםםםן‎ 
(int count) 00 U DU DDD DDD 0000 0 
0000000000000 
000 
በበበበበበበበ[በበ 
םםםםםםםםםם‎ 
shrink dca | 0 OQ ሀ O | void sb[ D U DU DDD DDD 0000 0 
che_sb OOOO | shrink dcache OO000000000000 
OOOO | sb (struct םםםםםםםםםםם‎ 
U U super block + 
sb) 
have subno | D 0 O O | int have subnow | parent 700 | םם‎ parent] ה‎ D 0 D 0 0 D 
unts OOOO nts (struct | 00000 םםםםםםםםםםםהםם‎ 
OOOO | dentry * parent) 
OOOO 
shrink dca | 0 0 0 O | void paret [00 1 0 0 0 0 D 0 D 0 D 0 0 0 0 
che parent | 000 shri nk_dcache 000000 בםםםםםםםםן‎ 
parent (struct [1 00 
dentry * parent) 
d alloc U D D D | struct በገ * | parent DOO |0000000000000 
000 d alloc (strut | 000000 |O000000000 הנא‎ 
dentry * parent, | 0 0 0 D nam | 00000000 
const struct gstr | [] [| [ gtr [] 
* nane) DUDU 
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A Linux API 
dinstati | ה‎ 000 | void Gnt YD D D D ነበበገበበበ በበ በበበ 
616 OOOO | dinstantiate םם‎ 0 0 0 0 0 D 0 D D 0 0 inde [] 
OOOO | (struct dentry | inode] 000 | cont D D D D D D D D 00 ከ 
HE entry, struct | 0 [ ፲ inode ם‎ ind D D D D D D D 0 D 
inode * inode) OO 
dallocro | ה‎ 0 [| Å | struct dentry | root inode ה‎ |0 0 00 inde00000 
ot OO d alloc rot|/0 00000 |" 00000 inode QQ 
(struct inode * | inode 0000000000000 
root i node) U D 0 D 0 D inoder[[ D 0 D 
U atu 
U U 
i U Du U U U U 0 0 U U U U 
በ d I ookup OOOO | struct dentry*d | parent 000 | Ü מםםםםהההההאת‎ 
በ OOO lookup (struct | 0 0 0 nang 0 (OOOOOOOOOOOOO 
በ dentry * parent, ה|‎ 00 0 D D |000000 19000000 
በ strut gir ההםה|*‎ at חםםםםהםםרהםהההםה|‎ 
በ nane) סםם‎ 0000000000000 
d put 000 
d validate | 0000 | int d validate | dentry מםםםםםםםםהםםםםם ם‎ 
OOOO | (struct dentry * | aparet 000 |0 deti D 00 0 D dpa 
0000 | dentry, םב םם‎ 0 010 0 0 DD daet D D D U 
00 struct dentry “ dparent 700 | ncpfs | readdir 0 [ 000 
dparent ) D00000 |0 detry0 D 0 D og 0 
OO 
d del ete OOOO | void d delete | dentry NTN 10 0 0 0 0 0 DD DDD 0 D 
סםם‎ (struct dentry * |00000 0000000000000 
dentry) 0000000000000 
d rehash 0000 | void በ rehash | dentryQ 00 10 0 0 0 0 0 DD D D D 0 D 
OOOO | (struct dentry * 00000 000000 
000 entry) 
d_nove 0000 | void d nove | dentry ה‎ 00 |0000000000000 
U Du (struct dentry ה|*‎ 00000 1000000 DD DDD 0 D 
dentry, target DOO 1 D D D D D D D 0 0 0 0 0 0 
struct dentry * 00 [] 
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(struct inode * 


inode, int sync) 
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(struct inode * 


inode) 

















(struct dentry * 





r block 
HHH H 
struct inode * 
get_ enpty inode 


int d unhashed dent 
( voi d) 


void cl ear inode 
int invalidate 


inodes (struct 


voi በ 
5 
sb); 
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U U U U 
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nax reserved 
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U U D U 
inode[] D 0 D 
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r block 
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inot iwi 
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void 
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renove ino | ה‎ | D ] | void הסג‎ 000 |D000000000000 
de hash OOOO | renove i node N0000 D00000 
OOOO | hash (struct 
ה‎ inode * inode) 
i put O00 D | voidiput (struct | inode] NAN (0000000000000 
0000 inode * inode) 00000 O000000000000 
0000 
bnap OOOO | int bap (struct | inode] NAN (0000000000000 
OOOO inode * inde ה ה|‎ 00 በ | [በ0000 100 40000 
0000 int Hoch O00 |D000000000000 
bl ock) ה‎ DU 0 0 
update ati | [| 0 0 O | void inode) [] O000000000000 
ne U D update ati ne 00000 O000000000000 
(struct inode * 0000000000000 
inode) QO" noatine" 111[]| 1 D 
“ noatine” JO 000000 
make bad i | |] I/O] | void nake bad | 18006[111 (0000000000000 
node 0000 inode (strut (NONONO (0000000000000 
0000 | inode 0 O00000000"0"00 
0000 # inode) 00000000 1/0000 
[] 
is badino | ה ה‎ D O | int is bad inode | inode TD ההה‎ (000000000000 
de OOOO | (struct inode * | 0 D D 0 0 DU 0 0000 
inode inode) 
DU D 
i 000 00 0000 DU D DU D 
register f ה|‎ [] D [] | int fs 111000 |0000000000000 
ilesystem | [| 0 O D | register filesys  ההה םהה‎ 0000000000000 
O0 tem (struct | 0 በበ 00000000000 
file sys- uu 
በ temtype * fs) 
| unregister | ה‎ 000 | int fs הםםםהה‎ 1[0000000[000000[0 
በ | filesyste | (OOOO unregi ster files | D D 000 (0000000000000 
በ m - ystem (struct | [] O000000000000 
በ file በ0000 
0 system type * fs) 00000000 file sys 
U temtype] 0000000 
get supr |0 0 Ú ከፒ | struct dev D000 |O000000000000 
OOOO | super bok הםםםה|*‎ O000000000000 
OG get super O000000000000 
(kdev t dev) 
6] Li mx [] [] D 
[] 000 ם‎ O 0000 0 B u [] 
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skb queue | [ D D D | int skb queue list DD [] D 0000000000000 
enpty 0000 | enpty (struct U U 
sk buff head + 
list) 
skb get OOOO | struct sk buff פפ|*‎ 0 0 D 0 0 | 0 0 0 0000000000 
ה‎ skb get (struct | 000 U DU 0000000 0 
sk buff * skb) 
kfree_skb OOOO | void kfree skb sk000000 |0O000000000000 
sk buff (struct sk buff * | QQ U D D 0 0000 0000 
skb) ה‎ 
skb cloned | ם ה‎ 0 O | int skb cloned skb הבה‎ 000 | 0 [ 1 skn 0መጩ[[1[ [0 
OOOO | (struct sk buff = |000 0000000000000 
U skb) 0000000000000 
0000000000000 
000000000000 
u t 
skb shared | 0 0 0 O | int skb shared sb 00000 O00000 D 0000 0 
OOOO | (struct sk buff * |000 בםםםםםםםם‎ 
U skb) 
skb share | ם‎ 000 | struct sk buff * sb 0 D 0 D 0 (0000000000000 
check OOOO | skb share check |Q0O00pri00 |0000000000000 
U D [[] | (struct sk buff = | 0000000 000000 1000000 
OOOO | skb int pri) 0000000000000 
U 0000000000000 
000000000000 
U B pri [] D] 0 GPAMC 
U D D 0 00000 NIL 
U U 
U Du u U DU 0 0 U U OO 
skb queue 1 |] 000 u32 skb queue | list 0 0 D | OO Sk buff 00000 
en 000 len (struct | QQ 
sk buff head + 
list_) 
__skb queue |) 0 0 0 | void list 00000 מםםםםםבההםהםהן‎ 
_head OOOO | _skb queue ה האאאםםם‎ |0000000000000 
OOOO | head (struct | 000000 000000000000 
H Sk buff head * 0000000000000 
list, struct 0000000 
sk buff * nevek) 
skb queue | [| OOO | void skb queue | list JANNO |000000000000 
ead OOOO | head (struct | 0 ה האאאתה‎ | D 0 D 0 D DD DD DDD D 
OOOO | sk buff head * | 000000 0000000000000 
0 list, struct םםםםםםם‎ 








sk buff * nevek) 
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